Empêcher Google de vous espionner, le retour 
Vous ne voulez pas que le robot d'indexation de Google indexe votre site dans ses bases de données ? Rien de plus simple, créez à la racine de votre site un fichier nommé "robots.txt" contenant ces lignes :

# Moteurs de recherche concernes
User-agent: googlebot
# Dossiers & fichiers non-accessibles
Disallow: /


Il est aussi possible de n'être référencé par aucun moteur de recherche :

# Moteurs de recherche concernes
User-agent: *
# Dossiers & fichiers non-accessibles
Disallow: /


Et même de ne bloquer que certains dossiers/fichiers :

# Moteurs de recherche concernes
User-agent: googlebot
# Dossiers & fichiers non-accessibles
Disallow: /logs/
Disallow: /temp/
Disallow: index.php
Disallow: cv.html


D'ailleurs, il est intéressant de noter que Google offre un tutoriel, un générateur et un testeur de "robots.txt" ; pour moi il sagit d'une preuve de bonne foi.
Et 4 teh lulz, voici le fichier "robots.txt" de... Google, justement ! :-)

Si vous souhaitez une solution plus radicale, il vous est possible de spécifier directement dans votre page Web au robot Google d'aller voir ailleurs si vous y êtes.

Pour éviter l'indexation de votre page, rajoutez cette balise entre les balises <head> et </head> de votre code :

<meta name = "robots" content = "noindex" />

Et pour éviter sa mise en cache rajoutez celle-ci :

<meta name = "robots" content = "noarchive" />

Promis, un de ces quatre je ferais un billet sur l'utilisation des balises "meta" !

[ Ajouter un commentaire ] ( 12 lectures )   |  [ 0 trackbacks ]   |  permalien  |   ( 3 / 2096 )

<<Premier <Précédent | 1 | 2 | 3 | 4 | 5 | Suivant> Dernier>>