EcommerceDEV. Développement, optimisation et sécurisation des sites de commerce électronique.
arrowAccueil arrow Optimisation arrow Performance arrow Cache de Google
Lundi 8 sept 2008
Nom d'utilisateur     Mot de passe      Conserver       Mot de passe perdu ?  Inscription
Menu
Accueil
A propos du site
Carte du site
Moteur de recherche
Nouvelles
Contactez-nous
Evénements
- - - - - - -
Analyse
Conception
Optimisation
Programmation
Sécurité
Produits/Services
Feb 21 2006
Cache de Google Version imprimable Suggérer par mail
Appréciation des utilisateurs: / 2
FaibleMeilleur 
Optimisation - Visibilité
Ecrit par webrankinfo.com   
21-02-2006
Cache de Google

"Pour indexer des millions de pages tous les jours, Google utilise une "armée" de robots d'indexation, appelés GoogleBot. A chaque fois qu'un de ces robots visite une page, il la récupère et la stocke sur un des serveurs de Google. Cette version du document est appelée la version cache. On comprend vite qu'avec 3 milliards de documents Google ait besoin de plus de 10 000 serveurs (et beaucoup de disques durs...).



A quoi sert le cache de Google ?


Pour la plupart des internautes, cela ne sert à rien ! Ils ne savent d'ailleurs pas que cela existe, ni comment y accéder. Néanmoins cela peut s'avérer utile dans différents cas de figure :

* Pour un internaute : une page est inaccessible ou introuvable (erreur 404). Si Google a indexé cette page, il est possible de la consulter en demandant sa version en cache.
* Pour un webmaster : la version en cache correspond à ce que GoogleBot a obtenu lorsqu'il est venu l'indexer. Cela permet par exemple de voir de quand date le document (en supposant que cette page est souvent mise à jour) ; cela permet aussi dans le cas de redirections de voir quelle page GoogleBot a vu.
* Comme preuve : si vous avez trouvé un site qui vous a plagié mais qui a retiré sa page, vous pouvez éventuellement utiliser la fonction de cache de Google pour le prouver (même si la valeur de cette preuve est toute relative...).
* Obtenir la version en cache d'un document


La manière la plus simple d'obtenir la version en cache d'un document est de cliquer sur "Copie cachée" à côté d'un résultat lors d'une recherche sur Google.


Il est possible également d'utiliser un opérateur spécial lors de la recherche : il faut utiliser la syntaxe cache:URL où URL est l'URL du document dont vous cherchez la version en cache.


Si vous avez installé la Google Toolbar, vous pouvez aussi cliquer dans la rubrique "Infos" sur le lien "Copie cachée de ce document".

Différentes versions en cache d'un même document


La fonction de cache donne parfois des résultats surprenants. Il faut savoir par exemple que la version en cache obtenue à partir de la Google Toolbar n'est pas toujours la même que celle obtenue en cliquant sur le lien "Copie cachée" dans une page de résultats. Ceci tient à un code supplémentaire passé en paramètre et indiqué uniquement sur la page de résultats.


Google dispose également de deux types de robots GoogleBot (lire l'article GoogleBot expliqué en détails pour en savoir plus). La version en cache d'un document peut être différente suivant le type de robot qui l'a indexé.


Par ailleurs, pour revenir sur ce lien "Copie cachée" dans les pages de résultats, on peut remarquer que dans le cas d'une page indexée par le FreshBot (le robot qui indexe le contenu qui change souvent), la date de la dernière version indexée est indiquée. Elle reste en général de 1 à 3 jours.
Dans le même ordre d'idée, il semblerait qu'il existe un troisième type de version en cache. Elle ne concerne que les pages faisant partie des sites d'actualité sélectionnés par Google dans le cadre de sa recherche "Google News". Dans ce cas, la version en cache ne contient que la partie textuelle identifiée par Google comme étant l'article à indexer.

Enfin, il arrive souvent que Google mette à disposition en cache une vieille version d'une page alors qu'il a déjà proposé une version plus récente. Bien que cette situation soit parfois désagréable pour le webmaster, il ne faut pas s'en inquiéter. Cela peut être dû au fait que 2 serveurs de Google n'ont pas la même version en cache. Le plus efficace pour remédier à ce problème est de parvenir à augmenter le PageRank de la page en question. En effet, le PageRank semble fait partie des critères utilisés par Google pour évaluer à quelle fréquence il doit indexer ce document. Si le PageRank est élevé, la page sera plus souvent indexée ; une page à PageRank 6 mise à jour quotidiennement par le webmaster peut être indexée tous les 1 à 2 jours par Google (la version en cache ne date alors pas de plus d'un ou deux jours)."


Par Olivier DUFFEZ, le 03/12/2003

Article paru initialement sur le site webrankinfo.com
 

Dernière mise à jour : ( 14-11-2006 )
< Précédent   Suivant >
Livre gratuit sur l'optimisation des applications Java/MySQL pour les besoins d'ecommerce
New Page 1

Kamal AOUDA a le plaisir de vous informer de la publication de son livre gratuit sur l'optimisation des applications Java/MySQL pour les besoins du commerce électronique. Ce livre  propose un référentiel pour l'intégration du management des performances aux trois premières phases du cycle de développement (analyse, design, codage). Comme son titre l'indique, ce livre ne traite que des problèmes de performance qui sont dus à des anomalies dans l'analyse, le design et le codage des applications de commerce électronique et des bases de données auxquelles elles sont adossées. Sont exclues du périmètre du livre les anomalies attribuables :

* Au réseau qui connecte l'application à l'Internet.
* Au serveur web et au serveur d'application.
* A la version de la Java Virtual Machine utilisée.
* A tout matériel utilisé par l'application localement ou à distance.
* Aux scripts exécutés du côté du client (Vbscript, Javascript).

Notons par ailleurs que le livre ne couvre que les phases d'analyse, de design et de codage. Les phases de test, de déploiement et de maintenance ont été sciemment exclues parce qu'il existe déjà un nombre conséquent de livres et d'articles qui traitent du management des performances dans ces 3 phases.

 

Pour télécharger gratuitement ce livre cliquez sur ce lien. Pour être au courant des mises à jour apportées à ce livre, nous vous recommandons de vous inscrire gratuitement à notre site en cliquant sur ce lien.
 

 

Moteur de recherche
Recommander ce site
Collaboration
Téléchargements
Derniers événements
Aucun événement
Sondages

Comment évaluez-vous la qualité des documents publiés sur ce site ?

  
Blogs Ecommerce
Blog de capitaine commerce
top

Ce site a été crée avec le CMS Mambo. Un logiciel gratuit disponible sous licence GPL.

Copyright Ecommerce DEV 2006.

Hosted by SiteGround