Google Analytics est l’outil par excellence pour mesurer le trafic d’un site Internet. Tout du moins, ça c’est dans la théorie. La réalité est tout autre puisque j’ai pu observer que Google Analytics sous-évalue très largement les résultats, par rapport à d’autres outils à paramétrage égal.
C’est par ma propre expérience que j’ai pu constater que Google Analytics nous trompe. L’écart constaté est d’ailleurs suffisamment important pour abandonner l’outil de la firme de Moutain View et passer à autre chose. Les habitués du blog ont constaté voilà peu l’arrivée de la publicité sur celui-ci (il faut bien faire bouillir la marmite). Pour gérer ces différents encarts, je dispose d’un tableau de bord sur les sites des annonceurs. Quelle ne fut pas ma surprise quand j’ai découvert un nombre d’affichages journaliers totalement incohérent par rapport à Google Analytics (qu’on abrègera GA pour le reste de l’article).
L’opération est simple : disposant de 2 encarts de publicité au moment du constat, j’aurai donc dû avoir un nombre d’impressions environ 2 fois supérieur au nombre de pages vues que m’indiquait GA (les pages statiques, sans pub, du site ne représentant qu’un faible pourcentage de trafic). Au lieu de ça, le chiffre qui m’était donné par l’annonceur était étonnamment beaucoup plus élevé, ce qui sous-entendait un nombre de pages vues et un nombre de visiteurs très différents. Je veux bien qu’il y ait des bots à passer et du spam referer que GA prend quand même en compte, mais tout de même… Ce chiffre me déplaisait d’autant plus que j’ai déjà des mesures en place pour bloquer les visiteurs fictifs qui ne sont pas de gentils bots, ainsi que les visiteurs de tous les pays qui sont des sources de tentatives de piratage. Je me renseigne un peu sur le sujet et découvre que je ne suis pas seul à faire ce constat.
Qu’est-ce qui justifie ces écarts ?
Plusieurs raisons à cela. Tout d’abord, l’utilisation d’un bloqueur de pub. Certains adblocks et consort empêchent tout simplement GA de comptabiliser le visiteur. Idem pour ceux qui ont désactivé l’exécution de Javascript. Mais en faisant quelques tests avec Ludivine Vinot, on s’est rendu compte qu’il y avait un autre facteur que nous n’avons pas réussi à déterminer : tous deux présents sur le site de l’autre, bloqueurs désactivés, je la voyais passer sur mon site via GA mais la réciproque n’était pas vraie. Il y a donc un vrai problème de tracking des visiteurs par GA. Et puisqu’il s’agit d’une grosse maison derrière, on serait tenté de ne pas remettre l’outil en question avant de constater ce type d’écart.
Le test d’une alternative
On entreprend donc de tester un second outil en parallèle à GA, WP Statistics. Certains l’auront compris, il s’agit d’un plug-in WordPress. D’assez bonne réputation, il nécessite toutefois un paramétrage assez fin pour ne pas trop alourdir la base de données SQL et ne pas comptabiliser des visiteurs qui n’en sont pas. Ainsi l’ai-je paramétré de façon assez sévère pour ne pas tricher.
- J’ai exclu pas mal de bots, en complétant la liste par défaut avec ma propre liste ;
- Les visiteurs provoquant plus de 20 hits par visite sont considérés comme des bots, donc non comptabilisés ;
- Je ne suis pas comptabilisé une fois connecté à mon administration ;
- Le flux RSS et la page 404 ne sont pas comptabilisés ;
- Si je bloque déjà du spam referer, l’outil permet d’en bloquer davantage ;
- Les navigateurs corrompus sont considérés comme des bots, donc non comptabilisés ;
- Sans parler des mesures déjà prises et dont je parle plus haut.
Comme vous pouvez le comprendre, il s’agissait d’obtenir un résultat le plus factuel possible. En voici ce que ça donne en quelques graphiques, sur une période de 20 jours.
Ainsi constate-t-on que les chiffres de WP Statistics sont environ 2 fois plus élevés ! Comme j’aime faire les choses correctement, j’ai pris un outil témoin sur 2 jours, sans aucun filtre afin de vérifier que WP Statistics fait bien son boulot. Comme vous le voyez ci-dessous, ça semble être le cas.
Pour m’assurer que ce n’était pas lié uniquement à mon site, j’ai également fait les mêmes observations sur mon blog personnel. Je n’ai malheureusement pas tous les éléments de réponse me permettant d’expliquer cet écart. Mais en début d’année 2016, j’ai remarqué sur GA une chute de visiteurs correspondant à peu près à l’écart que j’ai pu observer sur ces 20 jours. Pensant que c’était de mon fait, j’avais alors retourné le sujet dans tous les sens sans être en mesure de comprendre ce qui n’allait pas. Je ne cherche plus, j’ai retrouvé ces visiteurs perdus : GA me les avait tout simplement « mangé ».
Force est de constater que même les géants du web ont des efforts à faire et qu’il ne faut pas croire aveuglément les données qu’ils nous indiquent. Ainsi WP Statistics a désormais remplacé totalement Google Analytics sur mes sites. Bien évidemment, ce plug-in n’est pas aussi complet que son concurrent. Mais à moins que vous n’ayez des besoins d’analyse marketing spécifiques, vous y retrouverez une bonne partie des fonctionnalités, ce qui devrait être amplement suffisant.
Édit du 16 Janvier 2019
Après deux ans et demi d’utilisation, j’ai décidé de remiser WP Statistics au placard : depuis ses récentes mises à jour et le passage à WordPress 5.0, celui-ci ne comptabilise plus que 10% des visites. Tous les sites que j’ai en gestion et qui ont subi ces mises à jour souffrent de la même baisse de trafic d’un point de vue purement statistique. Je suis donc passé sur une autre solution, Matomo (anciennement Piwik). Après trois semaines de tests, cela m’a confirmé que WP Statistics a un gros problème. Malgré plusieurs mises à jour du plug-in, le souci n’est toujours pas résolu et le staff ne semble pas en prendre en compte. Matomo offre de nombreux avantages, a l’avantage d’être open source, s’autohéberge (pas de fuite des données) et peut fonctionner sans cookies. Je ferai peut-être un article dessus dans le courant de l’année.