Comment gérer les pages orphelines pour améliorer son référencement
Dès que l’on travaille l’optimisation de sites comportant des milliers de pages, on constate le phénomène suivant :
- certaines urls qui ne font pas partie de l’arborescence du site sont crawlées par Google. Parfois ces urls sont indexées et captent même un peu de trafic. Ces urls sont appelées « pages orphelines » en jargon SEO.
- et certaines urls, qui elles font partie de l’arborescence du site, sont ignorées par Google. C’est un autre sujet, que nous aborderons la semaine prochaine (« Comment faire pour que toutes mes pages soient indexées »).
Les urls censées faire partie de l’arborescence du site sont identifiables par un crawler, paramétré comme Googlebot. Les urls crawlées par Googlebot sont identifiables dans les logs serveurs (il suffit d’analyser les hits pour lesquels le « user agent » est Googlebot).
Dans ce premier article, nous allons nous intéresser plus spécialement au cas des pages orphelines.
L'article Comment gérer les pages orphelines pour améliorer son référencement a été publié sur secrets2moteurs.com