Tecnología

Inicio

Mi HTML Meta Robots no indice

La mayoría de los webmasters tienen en sus sitios de algunas páginas que no quieren los motores de búsqueda para indexar. El "noindex" etiqueta meta HTML es una manera de que los webmasters pueden decir a los motores de búsqueda no incluir una página Web en particular en el índice. Los principales motores de búsqueda respetarán la petición del webmaster.

¿Qué índice de búsqueda Motores

Cuando un motor de búsqueda rastreador Web encuentra por primera vez un sitio web, busca un archivo llamado "robots.txt". Este archivo indica al rastreador qué directorios y páginas en el sitio no se arrastren. El rastreador entonces visita a las otras páginas en el sitio por el siguiente esquema de enlaces internos del sitio. Cualquier página que contiene el contenido del motor de búsqueda puede indexar, por lo general la indexación a menos que la página contiene la "noindex" etiqueta meta.

¿Por qué los motores de búsqueda Índice Páginas Webmasters No desea indexar

Cuando se construye una nueva página web, a menudo no se sabe todas las páginas que desea bloquear en su archivo "robots.txt". plataformas comunes de sitios web a menudo incluyen páginas por defecto, como manuales de usuario que un webmaster que ni siquiera sabemos están ahí. Debido a esto, las páginas no están bloqueados antes de que el motor de búsqueda llega a la vista. También es posible que los motores de búsqueda rastrear el sitio antes de que un archivo "robots.txt" está en su lugar debido a que el webmaster inadvertidamente dejó que los motores de búsqueda saben que existe el sitio mediante la vinculación al sitio desde un sitio web diferente. Otro problema común es que los webmasters pondrán Google Analytics en el sitio demasiado pronto en el proceso de construcción del sitio. Esto informa a Google de que el sitio existe y puede causar Google para enviar el rastreador motor de búsqueda para el sitio para la indexación.

Usando el "Noindex" Meta Tag

Para indicar a los motores de búsqueda no indexar una página en particular en su sitio, coloque el código siguiente en la sección "cabeza" del código HTML de la página:

<Meta name = "robots" content = "NOINDEX">

Se pueden añadir otras etiquetas a la misma línea de dar instrucciones adicionales para los rastreadores. Por ejemplo, si usted también no desea seguir todos los rastreadores de enlaces de la página, utilice el siguiente código:

<META NAME = "robots" content = "NOINDEX, nofollow">

Consideraciones importantes

Si desea eliminar una página de índices de búsqueda, utilice la etiqueta "noindex", pero no bloquear la página en el archivo "robots.txt" de forma inmediata. Si lo hace, los motores de búsqueda no rastrear la página para ver la etiqueta nueva "noindex" y la página permanecerán en el índice más tiempo. Esperar para bloquear el acceso del rastreador a la página hasta después de que esté seguro de que el sitio no está indexado en los principales buscadores. Para la eliminación más rápida de una página del índice, Google y Bing ambos proporcionan una forma para que los webmasters para solicitar la eliminación de una página. Usted todavía tendrá que utilizar "noindex" en la página, sin embargo, como el motor de búsqueda puede encontrar la página de nuevo más tarde.