Tecnología

Inicio

Cómo bloquear el contenido duplicado Raspador Sitios

Cómo bloquear el contenido duplicado Raspador Sitios


rascadores sitios son sitios web que han reeditado el contenido de otro sitio Web sin autorización. Raspar el contenido de un sitio web es una violación de la propiedad intelectual. También crea problemas con la optimización de motores de búsqueda (SEO). El posicionamiento en buscadores es la práctica de obtener un sitio web o sus páginas a figurar de forma visible en las páginas de resultados de búsqueda del motor (SERP). El contenido duplicado en Internet puede afectar negativamente el ranking del motor de búsqueda del sitio web original.

Instrucciones

1 Abra un programa de transferencia de archivos (FTP) que se va a utilizar para acceder a los archivos de su sitio web. Usted necesitará una cuenta FTP con el fin de iniciar la sesión. Si no tiene uno, ir a la cPanel de su cuenta de alojamiento web. El cPanel es el panel de control principal que se hacen los ajustes.

Una vez que haya accedido a su Cpanel, busque la sección "Archivos". Abrir "cuentas FTP." En "Añadir FTP" cuenta, introduzca el nombre de usuario y la contraseña que desea para la cuenta.

Vuelve a tu programa de FTP. Bajo dominio, introduzca el dominio de su sitio web, y acceder con su cuenta de FTP nombre de usuario y contraseña.

2 Ir al directorio raíz o el directorio principal de su sitio web. Encontrar el archivo titulado ".htaccess". Haga clic derecho sobre el mismo, y haga clic en "Abrir / Editar." El documento .htaccess se abrirá en un programa de texto.

3 Resalte el código siguiente, y copiarlo.

El bloqueo de bots y arañas

En RewriteEngine

RewriteCond {} = REQUEST_URI sitemaps.xml

RewriteRule ^ sitemaps.xml [L]

RewriteCond% {} ^ REMOTE_HOST 77.91.224. * [O]

RewriteCond% {} HTTP_USER_AGENT ia_archiver [NC, OR]

RewriteCond% {} HTTP_USER_AGENT discobot [NC, OR]

RewriteCond% {} HTTP_USER_AGENT discobot [NC, OR]

RewriteCond% {} ^ HTTP_USER_AGENT BlackWidow [O]

RewriteCond% {} ^ HTTP_USER_AGENT Bot \ [O]

RewriteCond% {} ^ HTTP_USER_AGENT ChinaClaw [O]

RewriteCond% {} ^ HTTP_USER_AGENT Coste [O]

RewriteCond% {} ^ HTTP_USER_AGENT Disco [O]

RewriteCond% {} ^ HTTP_USER_AGENT Download \ Demonio [O]

RewriteCond% {} ^ HTTP_USER_AGENT eCatch [O]

RewriteCond% {} ^ HTTP_USER_AGENT EirGrabber [O]

RewriteCond% {} ^ HTTP_USER_AGENT EmailSiphon [O]

RewriteCond% {} ^ HTTP_USER_AGENT EmailWolf [O]

RewriteCond% {} ^ HTTP_USER_AGENT Express \ WebPictures [O]

RewriteCond% {} ^ HTTP_USER_AGENT ExtractorPro [O]

RewriteCond% {} ^ HTTP_USER_AGENT EyeNetIE [O]

RewriteCond% {} ^ HTTP_USER_AGENT FlashGet [O]

RewriteCond% {} ^ HTTP_USER_AGENT GetRight [O]

RewriteCond% {} ^ HTTP_USER_AGENT GetWeb! [O]

RewriteCond% {} ^ HTTP_USER_AGENT Go! Zilla [O]

RewriteCond% {} ^ HTTP_USER_AGENT Go-Ahead-GOT-It [O]

RewriteCond% {} ^ HTTP_USER_AGENT GrabNet [O]

RewriteCond% {} ^ HTTP_USER_AGENT Grafula [O]

RewriteCond% {} ^ HTTP_USER_AGENT HMView [O]

RewriteCond% {} HTTP_USER_AGENT HTTrack [NC, OR]

RewriteCond% {} ^ HTTP_USER_AGENT Imagen \ Stripper [O]

RewriteCond% {} ^ HTTP_USER_AGENT Imagen \ Sucker [O]

RewriteCond% {} HTTP_USER_AGENT Indy \ Library [NC, OR]

RewriteCond% {} ^ HTTP_USER_AGENT InterGET [O]

RewriteCond% {} ^ HTTP_USER_AGENT Internet \ Ninja [O]

RewriteCond% {} ^ HTTP_USER_AGENT JetCar [O]

RewriteCond% {} ^ HTTP_USER_AGENT JOC \ Web \ araña [O]

RewriteCond% {} ^ HTTP_USER_AGENT larbin [O]

RewriteCond% {} ^ HTTP_USER_AGENT LeechFTP [O]

RewriteCond% {} HTTP_USER_AGENT LinksManager.com_bot [NC, OR]

RewriteCond% {} HTTP_USER_AGENT linkwalker [NC, OR]

RewriteCond% {} ^ HTTP_USER_AGENT misa \ Downloader [O]

RewriteCond% {} ^ HTTP_USER_AGENT MIDown \ herramienta [O]

RewriteCond% {} ^ HTTP_USER_AGENT Señor \ PiX [O]

RewriteCond% {} ^ HTTP_USER_AGENT NavRoad [O]

RewriteCond% {} ^ HTTP_USER_AGENT NearSite [O]

RewriteCond% {} ^ HTTP_USER_AGENT NetAnts [O]

RewriteCond% {} ^ HTTP_USER_AGENT NetSpider [O]

RewriteCond% {} ^ HTTP_USER_AGENT Net \ Vampiro [O]

RewriteCond% {} ^ HTTP_USER_AGENT NetZip [O]

RewriteCond% {} ^ HTTP_USER_AGENT pulpo [O]

RewriteCond% {} ^ HTTP_USER_AGENT Desconectado \ Explorer [O]

RewriteCond% {} ^ HTTP_USER_AGENT Desconectado \ Navigator [O]

RewriteCond% {} ^ HTTP_USER_AGENT PageGrabber [O]

RewriteCond% {} ^ HTTP_USER_AGENT Papa \ Foto [O]

RewriteCond% {} ^ HTTP_USER_AGENT pavuk [O]

RewriteCond% {} ^ HTTP_USER_AGENT pcBrowser [O]

RewriteCond% {} ^ HTTP_USER_AGENT RealDownload [O]

RewriteCond% {} ^ HTTP_USER_AGENT ReGet [O]

RewriteCond% {} ^ HTTP_USER_AGENT SiteSnagger [O]

RewriteCond% {} ^ HTTP_USER_AGENT SmartDownload [O]

RewriteCond% {} ^ HTTP_USER_AGENT SuperBot [O]

RewriteCond% {} ^ HTTP_USER_AGENT SuperHTTP [O]

RewriteCond% {} ^ HTTP_USER_AGENT Surfbot [O]

RewriteCond% {} ^ HTTP_USER_AGENT Comida para llevar [O]

RewriteCond% {} ^ HTTP_USER_AGENT Teleport \ Pro [O]

RewriteCond% {} ^ HTTP_USER_AGENT VoidEYE [O]

RewriteCond% {} ^ HTTP_USER_AGENT Web \ Image \ Collector [O]

RewriteCond% {} ^ HTTP_USER_AGENT Web \ Sucker [O]

RewriteCond% {} HTTP_USER_AGENT Webalta [NC, OR]

RewriteCond% {} ^ HTTP_USER_AGENT webauto [O]

RewriteCond% {} HTTP_USER_AGENT WebCollage [NC, OR]

RewriteCond% {} ^ HTTP_USER_AGENT WebCopier [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebFetch [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebGo \ ES [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebLeacher [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebReaper [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebSauger [O]

RewriteCond% {} ^ HTTP_USER_AGENT sitio web \ eXtractor [O]

RewriteCond% {} ^ HTTP_USER_AGENT sitio web \ quester [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebStripper [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebWhacker [O]

RewriteCond% {} ^ HTTP_USER_AGENT WebZIP [O]

RewriteCond% {} ^ HTTP_USER_AGENT Wget [O]

RewriteCond% {} ^ HTTP_USER_AGENT Widow [O]

RewriteCond% {} ^ HTTP_USER_AGENT WWWOFFLE [O]

RewriteCond% {} ^ HTTP_USER_AGENT Xaldon \ Webspider [O]

RewriteCond% {} HTTP_USER_AGENT Yandex [NC, OR]

RewriteCond% {} HTTP_USER_AGENT Zermelo [NC, OR]

RewriteCond% {} ^ HTTP_USER_AGENT Zeus [NC, OR]

RewriteCond% {} HTTP_USER_AGENT ZyBorg [NC]

RewriteRule. * Bot-response.php [L]

4 Volver al archivo .htaccess. Pegar el código en el archivo .htaccess. Pegarlo encima de la línea "# END".

Guarde el archivo en su ordenador. Asegúrese de guardarlo como .htaccess. No añada extensiones a este archivo, por ejemplo, .htaccess.txt o .htaccess.html. Se debe guardarse sólo como .htaccess.

5 Volver al programa de FTP. La sección de "local" muestra los datos en el ordenador. Encuentra la carpeta y el archivo .htaccess guardó. La sección "Distancia" muestra el directorio de su sitio web. Arrastrar y soltar el archivo .htaccess del ordenador al directorio principal de su sitio web. Su sitio web está protegida contra los sitios del raspador.