Robots.txt Generator

Default - Tutti i robot sono

Crawl-Delay

Mappa del sito: (lasciare vuoto se non si dispone)

Ricerca Robots

Google

Immagine google

Google mobile

MSN Search

Yahoo

Yahoo MM

Yahoo Blog

Chiedi / Teoma

Gigablast

DMOZ Checker

Nutch

Alexa / Wayback

Baidu

Naver

MSN Picsearch

limitato directory

Il percorso è relativo alla radice e deve contenere slash "/"

Robots.txt è un file che contiene le istruzioni su come eseguire la scansione di un sito web. E ‘noto anche come protocollo di esclusione dei robot, e questo standard è utilizzato da siti per dire bot quale parte del loro sito ha bisogno indicizzazione. Inoltre, è possibile specificare quali aree non si desidera ottenere trattati da questi crawler; tali aree contengono contenuti duplicati o sono in fase di sviluppo. Motori di ricerca come rilevatori di malware, mietitrici di posta elettronica non seguono questo standard e sarà la scansione per i punti deboli nei vostri titoli, e v’è una notevole probabilità che inizieranno l’esame tuo sito dalle zone che non si desidera essere indicizzati.

Un file robots.txt completo contiene “User-agent”, e sotto di essa, è possibile scrivere altre direttive come “Consenti”, “Disallow”, “Crawl-Delay”, ecc, se scritta a mano si potrebbe prendere un sacco di tempo, e è possibile inserire più righe di comandi in un unico file. Se si desidera escludere una pagina, è necessario scrivere “Disallow: il link non si vuole il bot da visitare” stesso vale per l’attributo permettendo. Se si pensa che è tutto nel file robots.txt allora non è facile, una linea sbagliata può escludere la pagina dalla coda indicizzazione. Quindi, è meglio lasciare il compito ai pro, lasciate che il nostro robots.txt generatore di prendersi cura del file per voi.

Sapete questo piccolo file è un modo per sbloccare meglio rango per il tuo sito?

Le prime bot dei motori di ricerca di file guardano è il file txt del robot, se non viene trovato, quindi c’è una possibilità enorme che i crawler non indicizza tutte le pagine del tuo sito. Questo piccolo file può essere modificato in seguito quando si aggiungono più pagine con l’aiuto di piccoli istruzioni, ma fare in modo che non si aggiunge alla pagina principale nel respingere directive.Google viene eseguito su un budget strisciare; questo bilancio si basa su un limite di scansione. Il limite di scansione è il numero di crawler tempo spenderà su un sito web, ma se Google scopre che la scansione del tuo sito sta scuotendo l’esperienza utente, allora sarà la scansione del sito più lento. Questo significa che ogni volta più lenti Google invia ragno, controllerà solo poche pagine del tuo sito e il tuo post più recente ci vorrà tempo per ottenere indicizzati. Per rimuovere questa limitazione, il vostro sito web ha bisogno di avere una mappa del sito e un file robots.txt.

Come ogni bot ha strisciare preventivo per un sito web, questo rende necessario disporre di un file di miglior robot per un sito web wordpress pure. La ragione è che contiene un sacco di pagine che non ha bisogno di indicizzazione si può anche generare un robot WP file txt con i nostri strumenti. Inoltre, se non si dispone di robotica file txt, crawler sarà ancora indicizzare il tuo sito web, se si tratta di un blog e il sito non ha un sacco di pagine, allora non è necessario avere uno.

Se si sta creando il file manualmente, allora avete bisogno di essere a conoscenza delle linee guida utilizzate nel file. È anche possibile modificare il file in seguito, dopo aver appreso come funzionano.

  • Crawl-delay
    Questa direttiva è usato per prevenire crawler di sovraccaricare il padrone di casa, troppe richieste possono sovraccaricare il server che si tradurrà in un’esperienza utente negativa. Crawl-delay viene trattata in modo diverso da diversi bot dai motori di ricerca, Bing, Google, Yandex trattare questa direttiva in modi diversi. Per Yandex è un’attesa tra le visite successive, per Bing, è come una finestra di tempo in cui il bot visitare il sito una sola volta, e per Google, è possibile utilizzare la console di ricerca per controllare le visite dei bot.
  • Permettere
    direttiva che consente viene utilizzato per abilitare indicizzazione del seguente URL. È possibile aggiungere il numero di URL che vuoi soprattutto se si tratta di un sito di shopping allora la vostra lista potrebbe ottenere grandi. Eppure, utilizzare solo il file robot se il sito ha pagine che non si desidera ottenere indicizzati.
  • Impedire
    Lo scopo principale di un file Robots è quello di crawler rifiuti di visitare i link citati, le directory, ecc Queste directory, tuttavia, sono accessibili da altri bot che hanno bisogno di verificare la presenza di minacce perché non collaborano con lo standard.

Una mappa del sito è di vitale importanza per tutti i siti web in quanto contiene informazioni utili per i motori di ricerca. Una mappa del sito racconta bot quanto spesso si aggiorna il sito web che tipo di contenuti il sito fornisce. Il suo motivo principale è quello di informare i motori di ricerca di tutte le pagine il sito ha che ha bisogno di essere sottoposti a scansione, mentre la robotica txt file è per i crawler. Racconta crawler quale pagina a passo d’uomo e che non a. Una mappa del sito è necessario al fine di ottenere il vostro sito indicizzato mentre txt del robot non è (se non si dispone di pagine che non hanno bisogno di essere indicizzati).

Robot txt di file è facile da fare, ma le persone che non sono consapevoli di come, hanno bisogno di seguire le seguenti istruzioni per risparmiare tempo.

  1. Quando sei arrivato sulla pagina del New robot txt generatore , si vedrà un paio di opzioni, non tutte le opzioni sono obbligatorie, ma è necessario scegliere con attenzione. La prima riga contiene, i valori di default per tutti i robot e se si desidera mantenere un crawl-delay. Lasciare così come sono se non si desidera cambiare loro come mostrato nella immagine qui sotto:
  2. La seconda fila è di circa sito, assicuratevi di avere uno e non dimenticare di menzionare nel file txt del robot.
  3. Dopo questo, è possibile scegliere tra un paio di opzioni per i motori di ricerca, se si desidera motori di bot per strisciare o meno la ricerca, il secondo blocco è per le immagini, se avete intenzione di permettere la loro indicizzazione terza colonna è per la versione mobile del sito web.
  4. L’ultima opzione è per Impedire, dove potrete limitare i crawler di indicizzare le aree della pagina. Assicurarsi di aggiungere la barra prima di riempire il campo con l’indirizzo della directory o pagina.

Altre lingue: English, русский, 日本語, italiano, français, Português, Español, Deutsche, 中文