robots.txt GENERADOR

Defecto - Todos los robots son

Rastreo de retardo

Mapa del sitio: (dejar en blanco si no tiene)

Los robots de búsqueda

google

imagen de Google

google Mobile

MSN Search

yahoo

yahoo MM

yahoo Blogs

Solicitar / Teoma

Gigablast

DMOZ Comprobador

Nutch

Alexa / Wayback

Baidu

Naver

MSN PicSearch

restringido Directorios

La ruta es relativa a la raíz y debe contener una barra diagonal "/"

Robots.txt es un archivo que contiene instrucciones sobre cómo rastrear un sitio web. También se conoce como protocolo de exclusión de robots, y esta norma es utilizado por los sitios de decir a los robots de qué parte de su sitio web necesita indexación. Además, puede especificar qué áreas que no quiere quedar procesado por estos rastreadores; estas áreas contienen contenido duplicado o se están desarrollando. Motores de búsqueda como los detectores de malware, cosechadoras de correo electrónico no siguen esta norma y buscará los puntos débiles de sus valores, y existe una probabilidad considerable de que van a comenzar a examinar su sitio desde las áreas que no desea ser indexados.

Un archivo robots.txt completa contiene “User-agent”, y debajo de ella, puede escribir otras directivas como “Permitir”, “No permitir”, “Crawl-Delay”, etc si está escrita de forma manual puede ser que tome mucho tiempo, y puede introducir varias líneas de comandos en un archivo. Si desea excluir una página, tendrá que escribir “Disallow: el enlace no quiere que los robots para visitar” mismo ocurre con el atributo que permite. Si cree que eso es todo lo que hay en el archivo robots.txt, entonces no es fácil, una línea equivocada puede excluir a su página de la cola de indexación. Por lo tanto, es mejor dejar la tarea a los profesionales, dejar que nuestro generador de robots.txt cuidar del archivo para usted.

Sabes este pequeño archivo es una manera de desbloquear una mejor clasificación de su sitio web?

Los primeros robots de los motores de búsqueda de archivos es miran archivo txt del robot, si no se encuentra, entonces existe la posibilidad de que los rastreadores masiva no indexará todas las páginas de su sitio. Este archivo pequeño puede ser alterado más adelante cuando se agrega más páginas con la ayuda de pequeñas instrucciones, pero asegúrese de que no se agrega la página principal de la disallow directive.Google se ejecuta en un presupuesto de rastreo; este presupuesto se basa en un límite de rastreo. El límite de rastreo es el número de orugas de tiempo va a pasar en un sitio web, pero si Google se entera de que el rastreo de su sitio está sacudiendo la experiencia del usuario, entonces será rastrear el sitio más lento. Este lento significa que cada vez que Google envía araña, sólo comprobar unas pocas páginas de su sitio y su cargo más reciente tomará tiempo para la indexación. Para eliminar esta restricción, su sitio web debe tener un mapa del sitio y un archivo robots.txt.

Como cada robot tiene rastreo presupuesto de una página web, esto hace que sea necesario contar con un archivo mejor robot para un sitio web de WordPress también. La razón es que contiene una gran cantidad de páginas que no necesita la indexación incluso se puede generar un archivo txt robots WP con nuestras herramientas. Además, si usted no tiene robótica archivo txt, rastreadores seguirá siendo el índice de su sitio web, si se trata de un blog y el sitio no tiene una gran cantidad de páginas, entonces no es necesario tener una.

Si va a crear el archivo manualmente, entonces usted necesita para estar al tanto de las directrices utilizadas en el archivo. También es posible modificar el archivo más tarde después de aprender cómo funcionan.

  • Crawl-delay
    Esta directiva se utiliza para evitar que los rastreadores de sobrecargar el anfitrión, demasiadas peticiones pueden sobrecargar el servidor que dará lugar a la mala experiencia del usuario. Rastreo de retardo es tratado de manera diferente por diferentes robots de los motores de búsqueda, Bing, Google, Yandex tratar esta directiva de diferentes maneras. Para Yandex es una espera entre las visitas sucesivas, para Bing, es como una ventana de tiempo en el que el robot visitará el lugar sólo una vez y para Google, puede utilizar la consola de búsqueda para controlar las visitas de los robots.
  • Permitiendo
    Directiva permitiendo se utiliza para habilitar la indexación de la siguiente URL. Puede añadir tantas direcciones URL como desee en especial si se trata de un sitio de compras a continuación, la lista podría obtener grandes. Sin embargo, sólo se utilice el archivo de robots si su sitio tiene páginas que no desea para la indexación.
  • Rechazando
    El propósito principal de un archivo de robots es que los rastreadores de basura de visitar los enlaces mencionados, directorios, etc. Estos directorios, sin embargo, se accede por otros robots que necesitan para comprobar en busca de malware, ya que no cooperan con la norma.

Un mapa del sitio es vital para todos los sitios web, ya que contiene información útil para los motores de búsqueda. Un mapa del sitio le dice a los robots de la frecuencia con que actualizar su sitio web que tipo de contenido de su sitio ofrece. Su principal motivo es notificar a los motores de búsqueda de todas las páginas de su sitio tiene que necesita ser rastreado mientras que la robótica es un archivo txt para los rastreadores. Se indica a los rastreadores qué página a gatear y cuáles no. Un mapa del sitio es necesario con el fin de obtener su sitio indexado mientras txt del robot no es (si usted no tiene las páginas que no necesitan ser indexados).

Los robots txt archivo es fácil de hacer, pero las personas que no son conscientes de cómo, tienen que seguir las siguientes instrucciones para ahorrar tiempo.

  1. Cuando haya aterrizado en la página de Nuevos robots txt generador , verá un par de opciones, no todas las opciones son obligatorios, pero hay que elegir con cuidado. La primera fila contiene, valores por defecto para todos los robots y si desea mantener un rastreo de retardo. Dejarlos como están si no desea modificarlos como se muestra en el siguiente imagen:
  2. La segunda fila está a punto de mapa del sitio, asegúrese de que tiene uno y no se olvide de mencionar que en el archivo txt del robot.
  3. Después de esto, se puede elegir entre un par de opciones para los motores de búsqueda si desea que los motores bots para rastreo o no buscar, el segundo bloque es para las imágenes si se va a permitir que su indexación de la tercera columna es para la versión móvil de la sitio web.
  4. La última opción es para que se anule, donde podrá restringir los rastreadores de la indexación de las áreas de la página. Asegúrese de añadir la barra diagonal antes de llenar el campo con la dirección del directorio o página.

Otros idiomas: English, русский, 日本語, italiano, français, Português, Español, Deutsche, 中文