Alcuni giorni fà mi sono imbattuto in un sito che aveva un robots.txt alquanto particolare 😀
In pratica al suo interno aveva la direttiva :
Disallow: /robots.txt
Incuriosito dalla cosa ho dato in pasto l’immagine sopra ai social network attendendo la replica delle persone, questo il risultato :
Google Plus
Valentina Lepore
È tipo un mistero di fatima, puoi solo dire…uau?
Pasquale Altamura
un harakiri che non funziona 🙂
Facebook
Simone Righini
qualcuno con la voglia di sperimentare mondi alternativi!
Federico Santarelli
Ma non innesca un loop?
Manuel Fae
È un robots che si morde la lingua 🙂
Marco Massara
È un suicidio
Simone Righini
Luca Lizzeri sperimentatori di universi paralleli ne conosciamo in effetti… ho un sospetto!
Antony Coia
😀
Alessandro Giagnoli
Lo spider va a leggere prima il robots, quindi lo legge ugualmente. Praticamente e’ un comando inutile in realta’. No?
Andrea Serravezza
Doppia mandata…
Enrico Altavilla
Può essere causato da una carenza di logica di chi l’ha creato o da una carenza di conoscenza sulla funzione del robots.txt. Più probabilmente è la seconda, magari il tipo è convinto che il robots.txt serva a chiedere ai motori che cosa non indicizzare.
Simone Righini
ma la vera domanda è: la prossima volta google ci torna a leggere il file o esilia per sempre il sito internet?
Enrico Altavilla
Simone: ovviamente ci torna. Non potrebbe prendere decisioni sul sito sulla base di un contenuto presunto. Se lo facesse, vanificherebbe la logica e la funzione stessa del robots.txt
Claudio De Paolo
Scommetto che se qualcuno gli suggerisce un noindex nofollow in home page non ci pensa 2 volte a metterlo
Carlo Casciaro
bhe anche su tutte le pagine :-))
Sicuramente sarà contattato da Gooogle per ricevere il premio “Minchia del secolo”
Credo sia chiaro a tutti che è il caso di rivedere la sintassi di quel robots.txt 😉
Un commento
[…] Robots.txt Errata Sintassi […]