Depuis l'affichage instantané des aperçus de pages dans les résultats Google, certains s'étaient rendus compte d'un mauvais décompte des pages vues dans Google Analytics. Voilà les explications et la solution...
Etant donné que le robot Google en charge de la création de certains aperçus (snapshots, screenshots) exécute le code JavaScript (pour s'assurer d'un bon rendu), ses visites sont enregistrées dans Google Analytics. En réalité, la plupart des vignettes sont créées par le robot Googlebot classique, et sont gérées avec un système de cache. Dans ce cas, il ne semble pas y avoir de problème. Mais quand ce robot n'est pas parvenu à créer l'aperçu, alors il est généré à la volée au moment où un internaute cherche à y accéder depuis une page de résultats Google. C'est dans ce cas précis que le bot Google Preview est sollicité.
L'impact peut bouleverser un certain nombre de métriques. En effet, ces robots augmentent artificiellement le nombre de visites, mais consultent une seule page par visite, ce qui fait chuter le nombre moyen de pages par visite, la durée moyenne de visite, les taux de conversion ou autres indications de valeur.
Google a heureusement corrigé ce problème, comme annoncé le 22 novembre dernier. Malheureusement, les données erronées ne vont pas être retraitées. Si vous souhaitez effectuer des analyses fiables sur votre site, voici 2 solutions :
- Créer un segment avancé basé sur le fournisseur d'accès (pour Google Preview c'est "Google Inc."), en rajoutant éventuellement des contraintes comme le nombre de pages vues par visite (égal à 1). On détaille ces segments avancés en formation Google Analytics régulièrement.
- Filtrer le crawler Google Preview en amont en détectant son nom d'agent et en supprimant le tracking Analytics quand on le reconnait. Cette solution n'est plus nécessaire depuis que Google a corrigé le bug.
Le nom d'agent complet de Google Preview (user agent) est :
Mozilla/5.0 (en-us) AppleWebKit/525.13 (KHTML, like Gecko; Google Web Preview) Version/3.1 Safari/525.13
On se demande pourquoi il se fait passer pour Safari...
Le bug ayant été corrigé, ceci n'est plus important pour ceux qui utilisent Google Analytics. Cela dit cet article a pour but de vous relayer l'info et de vous indiquer de quelle façon on pouvait détecter ce robot chargé de la création des vignettes Google. Pour ceux qui veulent en savoir plus (car tout le monde n'utilise pas Google Analytics !), consultez cette FAQ officielle. On y apprend notamment que :
- le robot gère JavaScript, AJAX, CSS3, les frames et iframes mais pas Flash, Silverlight ou les applets Java
- Google rappelle également qu'il est interdit d'effectuer du cloaking pour fournir à ce robot un contenu différent de celui fourni aux internautes...
- Il est possible de bloquer Google Preview en utilisant une balise meta robots nosnippet, mais le snippet classique (2 lignes de texte en général) sera également supprimé...