EcommerceDEV. Développement, optimisation et sécurisation des sites de commerce électronique.
arrowAccueil arrow Optimisation arrow Visibilité arrow Exemple de cloaking en PHP
Samedi 22 nov 2008
Nom d'utilisateur     Mot de passe      Conserver       Mot de passe perdu ?  Inscription
Menu
Accueil
A propos du site
Carte du site
Moteur de recherche
Nouvelles
Contactez-nous
Evénements
- - - - - - -
Analyse
Conception
Optimisation
Programmation
Sécurité
Produits/Services
Oct 15 2006
Exemple de cloaking en PHP Version imprimable Suggérer par mail
Appréciation des utilisateurs: / 1
FaibleMeilleur 
Optimisation - Visibilité
Ecrit par Kamal AOUDA   
15-10-2006
Exemple de cloaking en PHP

Cet article montre comment on peut faire du cloaking en PHP. Il est important de noter que le cloaking est une pratique réprouvée par les principaux moteurs de recherche. Son utilisation à des fins abusives/frauduleuses peut se solder par le retrait de votre site des résultats des moteurs de recherche et sa consignation sur une liste noire comme l’expliquent les deux articles suivants :
 

Le cloaking, présentation et risques encourus.

BMW exclue de l'index de Google


Nous donnons cet exemple à des fins éducatives seulement. Nous vous déconseillons de le mettre en œuvre sur votre site compte tenu des risques encourus (la meilleure façon d’améliorer la visibilité de votre site sur les moteurs de recherche est de produire des contenus pertinents et populaires).

Nous rappelons que le cloaking consiste à présenter aux robots des moteurs de recherche des pages et/ou des contenus différents de ceux présentés aux utilisateurs humains. La détection de l’origine de la requête se fait sur la base de l’adresse IP ou du USER-AGENT contenu dans l’entête du paquet http (à noter que la technique qui utilise l’adresse IP est plus fiable sans être toutefois infaillible).

En PHP il est possible de récupérer les informations du USER-AGENT via la variable d’environnement $_SERVER["HTTP_USER_AGENT"]. L’adresse IP pour sa part est disponible via la variable $_SERVER["REMOTE_ADDR"].

Avant de commencer à coder vous devez connaître la liste des USER-AGENT et des adresses IP y afférentes. Comme ces données changent vous devez vous assurez de la mise à jour périodique de cette liste (la dernière liste connue est reproduite à la fin de cet article).

Avec la technique des wild cards vous pouvez vérifier la présence de certaines suites de caractères dans l'user-agent, l'adresse IP ou l'hôte du visiteur (cela vous permet de déterminer l’origine de la requête par échantillonnage c'est-à-dire sans avoir à contrôler toutes les informations contenues dans le USER-AGENT).


Exemple 1 : cloaking sur la base du USER-AGENT


Dans l’exemple suivant, la fonction strpos() vérifie la présence des chaînes de caractères propres à Googlebot. Si la requête émane de Googlebot une page cloakée est générée à la volée, sinon il y a génération d’une page standard conçue pour les utilisateurs humains.
 

<?php
$trouve=strpos($_SERVER["HTTP_USER_AGENT"],"Googlebot");
if($trouve!==false){ // le visiteur est Googlebot, lui présenter la page cloakée
?>
<html>
... page cloakée pour Googlebot. </html>
<?php
}
else{ // le visiteur n'est pas googlebot, redirection vers une page standard?>
<html>
... page standard...
</html>
<?php
}
?>

Exemple 2 : Cloaking sur la base de l’adresse IP

Dans ce code trois pages différentes seront présentées aux visiteurs (une pour Googlebot, une pour le robot Inktomi et une troisième pour les autres utilisateurs).

<?php
$adresseip=strval($_SERVER["REMOTE_ADDR"]);
$google1=strpos($adresseip,"216.239.46");
$google2=strpos($adresseip,"64.68.8");
$google3=strpos($adresseip,"66.249.");
$slurp=strpos($adresseip,"66.196");
if(($google1!==false) || ($google2!==false) || ($google3!==false) || ($slurp!==false)){
// le visiteur est Googlebot ou Inktomi, lui présenter la page cloakée
?>
<html>
... page HTML cloakée pour Googlebot et Inktomi

</html>
<?php
}
else{ // le visiteur n'est ni Googlebot ni Inktomi, lui présenter la page "standard"
?>
<html>
... page HTML "standard"...
</html>
<?php
}
?>

Liste des USER-AGENT et des adresses IP des principaux moteurs de recherche.

Adresses IP et USER-AGENT des principaux moteurs de recherche

 

Moteur de recherche: Google
 

Robot: Googlebot
User-agent: Googlebot/2.1 (+http://www.google.com/bot.html) ou
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Hôtes (DNS)

Adresses IP

crawl**.googlebot.com

66.249.**.**

 

Moteur de recherche: MSN (Microsoft)

 

Robot: MSNBot
User-agent:
msnbot/1.0 (+http://search.msn.com/msnbot.htm) ou
msnbot/0.3 (+http://search.msn.com/msnbot.htm)

Hôtes (DNS)

Adresses IP

msnbot.msn.com ou adresse IP

207.68.146.***

msnbot.msn.com ou adresse IP

65.54.188.***

 

Moteur de recherche: Yahoo!

Robot: Yahoo! Slurp
User-agent:
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
 

Hôtes (DNS)

Adresses IP

xxxxx.inktomisearch.com

66.196.***.***

xxxxx.inktomisearch.com

68.142.***.***

 

Moteur de recherche: Voila

Robot: VoilaBot
User-agent: Mozilla/4.0 (compatible; MSIE 5.0; Windows 95) VoilaBot BETA 1.2 (http://www.voila.com/)
 

Hôtes (DNS)

Adresses IP

x1crawler*-1-0.x-echo.com

195.101.94.***

 

Moteur de recherche: WiseNut

Robot: ZyBorg
User-agent: Mozilla/4.0 compatible ZyBorg/1.0 ( ; http://www.WISEnutbot.com)
 

Hôtes (DNS)

Adresses IP

64.241.243.65

64.241.243.65

an-zyborg-g**.looksmart.com

209.249.67.1**

fdevoid1.looksmart.com

64.241.242.177

 

Moteur de recherche: Fast

Robot: Fast Web Crawler
User-agent: FAST-WebCrawler/3.6 (atw-crawler at fast dot no; http://fast.no/support/crawler.asp)
 

Hôtes (DNS)

Adresses IP

c***.sac2.fastsearch.net

66.77.73.***

User-agent: FAST-WebCrawler/3.7/FirstPage (atw-crawler at fast dot no;http://fast.no/support/crawler.asp)
 

Hôtes (DNS)

Adresses IP

***.sac2.fastsearch.net

66.77.73.***

User-agent: FAST-WebCrawler/3.8 (atw-crawler at fast dot no; http://fast.no/support/crawler.asp)
 

Hôtes (DNS)

Adresses IP

m***.sac2.fastsearch.net

66.77.73.***

 

Moteur de recherche: DeepIndex

Robot: DeepIndex bot
User-agent: DeepIndex
 

Hôtes (DNS)

Adresses IP

deepindex.net1.nerim.net

62.212.117.198

 

Moteur de recherche: Teoma

Robots: Teoma, DirectHit
User-agent: Mozilla/2.0 (compatible; Ask Jeeves/Teoma)
 

Hôtes (DNS)

Adresses IP

egspd***.teoma.com

65.214.36.***

ghost.directhit.com

65.214.38.10

 

Moteur de recherche: Whalhello

Robots: appie
User-agent: appie 1.1 (www.walhello.com)
 

Hôtes (DNS)

Adresses IP

qn-212-127-141-180.quicknet.nl

212.127.141.180

qn-213-73-184-**.quicknet.nl

213.73.184.**

 

Moteur de recherche: Gigablast

Robots: Gigabot
User-agent: Gigabot/1.0
 

Hôtes (DNS)

Adresses IP

gigablast.com

216.243.113.1

 

Moteur de recherche: Mirago

Robots: HenriLeRobotMirago
User-agent: HenriLeRobotMirago
 

Hôtes (DNS)

Adresses IP

217.205.60.225

217.205.60.225

 

Moteur de recherche: picsearch

Robots: Psbot
User-agent: psbot/0.1 (+http://www.picsearch.com/bot.html)
 

Hôtes (DNS)

Adresses IP

sp5.picsearch.com

62.119.21.157

 

Moteur de recherche: Szukacz

Robots: Szukacz robot
User-agent: Szukacz/1.5 (robot; www.szukacz.pl/jakdzialarobot.html; )
 

Hôtes (DNS)

Adresses IP

robot.szukacz.pl

193.218.115.6

 

Moteur de recherche: Openfind

Robots: Openbot
User-agent: Openfind data gatherer, Openbot/3.0+(robot- ;+http://www.openfind.com.tw/robot.html)
 

Hôtes (DNS)

Adresses IP

robot2.openfind.com.tw

210.59.144.149

66.237.60.22

66.237.60.22

 

Moteur de recherche: Naver

Robots: dloader
User-agent: dloader(NaverRobot)/1.0
 

Hôtes (DNS)

Adresses IP

218.145.25.***

218.145.25.***

(* : variables des hôtes et adresse IP)

Dernière mise à jour : ( 09-11-2006 )
< Précédent   Suivant >
Benchmarks de performance

Les benchmarks de Keynote Systems sont conçus pour permettre aux entreprises de comparer la performance de leurs sites de commerce électronique avec celle de leurs principaux concurrents. Au-delà d’une simple mesure des indicateurs traditionnels comme le débit et le temps de réponse, les benchmarks de Keynote tiennent compte des cas d’utilisation et des contraintes sectorielles. Pour plus d’informations sur les benchmarks de Keynote, leur méthodologie et leur utilité, consulter les articles suivants :


 

* Keynote Index : benchmarking des performances des sites E-commerce.

* Perception de la performance par les utilisateurs, le temps de réponse.

 

 

Cliquer sur ce lien pour voir les résultats du mois de décembre 2005: 

 

Hébergement PHP, Mambo, MySQL
Web hosting services
Moteur de recherche
Recommander ce site
Collaboration
Téléchargements
Derniers événements
Aucun événement
Sondages

Temps de réponse tolérable pour afficher la page d’accueil d’un site e-commerce

  
Blogs Ecommerce
Blog de capitaine commerce
top

Ce site a été crée avec le CMS Mambo. Un logiciel gratuit disponible sous licence GPL.

Copyright Ecommerce DEV 2006.

Hosted by SiteGround