Webmastering

Spams sur Google Analytics (Darodar, Blackhatworth, Ilovevitaly, Econom.co)

Utiliser un outil permettant d’analyser l’audience d’un site web est devenu indispensable pour les webmasters. Blogelin ne déroge pas à la règle, et utilise Google Analytics.

Depuis quelques jours, j’ai remarqué quelques pics d’audiences un peu bizarres sur mon blog. J’ai décidé de creuser un peu et je me suis aperçu que ces pics étaient provoqués par des sources russes. Ça y est, des hackers veulent m’embêter et je vais passer les prochains jours à flipper… Mais après quelques recherches sur internet, je suis tombé sur des informations très intéressantes.

Google Analytics et le spam

Les sources russes dont je parlais précédemment venaient toutes du site Darodar.com, visiblement très connu depuis la fin de l’année dernière. Si on regarde dans les sites référents, on tombe sur ça :

Spams-Darodar

Malheureusement, ce site n’est pas le seul et ils sont nombreux comme Blackhatworth, Ilovevitaly, Priceg, ou Econom.co.

J’ai appris que ces spams ne visent pas les sites (le soulagement…) mais Google Analytics et ses utilisateurs. En réalité, ils ne vont jamais sur notre site. Ils utilisent seulement le numéro d’identification et le code Analytics. Google n’a plus qu’à enregistrer dans nos rapports ces requêtes jugées légitimes.

Pour vérifier ceci, il suffit de regarder dans votre rapport : Vue d’ensemble.
Lorsque vous regardez vos statistiques par Page, vous tombez sur vos pages visitées (jusque-là, tout est normal) :

Analytics-page

Mais si vous triez par « Titre de page », vous tombez sur quelque chose de vraiment bizarre. Une page supplémentaire nommée Co.lumb est apparue…

co.lumb

En fait, ces scripts contactent Google Analytics sans passer par nos sites. C’est pour cela que nous voyons dans nos statistiques une page qui ne correspond pas à une page de notre site.

Pourquoi ce spam ?

En dehors du fait que cela soit juste pour nous emmerder en faussant nos statistiques, ces spams nous redirigent vers des liens commerciaux voir pire, vers des virus. Du moins lorsqu’on décide d’être curieux et d’aller voir ce qui se cache derrière un site référent bizarre. Ce que je vous déconseille de faire !

Comment se protéger du spam ?

Tout d’abord, sachez que le blocage d’un site référent via le fichier .htaccess n’apporte strictement rien étant donné que ces spams ne contact jamais votre site.

Google propose une solution qui consiste à exclure de nos statistiques tous les appels provenant des robots connus. Pour cela, rendez-vous dans votre partie Admin, puis dans Paramètres de la vue. Vous n’avez plus qu’à cocher la case « Exclure tous les appels provenant de robots connus« .

filtrage-des-robots

Cependant, après quelques jours cela n’a rien changé dans mes statistiques. Darodar et la page Co.lumb sont toujours présents.
Ça reste quand même une option intéressante que je conseille d’activer afin d’éviter de perdre son temps avec les robots déjà recensés par Google.

Bon d’accord, je vous ai vendu du rêve et ça ne fonctionne pas… Mais j’ai trouvé une autre solution (qui fonctionne cette fois) : activer un filtre. Le principe est donc de demander à Google Analytics de ne pas afficher les résultats de ces spams.

Pour cela, toujours dans la page Admin, allez dans Filtres. Puis cliquez sur Nouveau filtre.  Appliquez les paramètres ci-dessous :

filtre-darodar

Dans cet exemple, j’ai tenté de bloquer les données provenant du site référent Darodar.com mais cela ne fonctionne pas. La solution que j’ai choisi ici consiste à bloquer les données qui se connectent à la page imaginaire Co.lumb (et donc Darodar). Ce n’est pas forcément effectif immédiatement, et il faudra parfois attendre 24h.

Effectuez la même opération pour les autres comme Blackhatworth, Ilovevitaly ou Priceg, selon les spams que vous subissez.

Vous l’aurez compris, l’activation de ce filtre ne corrige pas le problème puisque cela ne fait que masquer le spam. Mais à notre niveau, nous ne pouvons rien faire. Cela dépend de Google ! Alors, en attendant qu’ils corrigent ce problème, cette solution de contournement permet de rendre vos statistiques un peu plus pertinentes.

Vous avez évidemment la possibilité de faire la même opération pour les autres liens que vous considérerez comme du spam. Attention cependant à être sûr que ces spams n’attaquent pas votre site en direct ! Si c’est le cas, le blocage via le fichier .htaccess sera une solution supplémentaire.

Avis de professionnels

Enfin, j’ai demandé l’avis de mon hébergeur concernant ces spams (qu’ils visitent ou non le site) et voici la réponse :

Les sites sur internet se font constamment visiter par des centaines de robots différents et parfois par des scripts qui essayent de savoir ce qui se cache derrière un site web.
Si vous gardez votre site à jour ainsi que ses plugins et thèmes, et que vous avez de fort mots de passe, vous n’avez pas de soucis à vous faire.

Rappelez-vous que la majorité de ces spams ne visitent pas votre site et ne servent qu’à fausser vos rapports Google Analytics. Si vous n’avez pas envie de vous battre avec tout ça, la solution est vite trouvée : trouver une alternative à Google Analytics ! :)

Alternatives à Google Analytics

Pour vous protéger de ce spam, vous avez également la possibilité d’utiliser un autre outil d’analyse. Je vous invite à lire l’article suivant qui vous propose 6 alternatives à Google Analytics :

6 alternatives à Google Analytics

À propos de l'auteur

Mr Gobelin

Geek, passionné de web et de nouvelles technologies, errant sur la toile à la recherche de choses à se mettre sous la dent.

8 Commentaires

  • J’ai mis en place les filtres sur GA, et comme je n’avais pas la page Co.lumb comme indiqué dans l’article, j’ai quand même bloqué les spam via le fichier .htaccess et ça a l’air de fonctionner.
    Pour info, j’en ai eu un autre (je sais que la liste n’était certainement pas exhaustive mais si ça peut aider) : Hulfingtonpost.com .

    • Le souci avec ce genre de spam c’est qu’ils sont susceptibles de changer régulièrement.
      Pendant 5 jours, je n’ai plus eu aucun spam, puis c’est revenu (j’y ai cru !). Toujours venant de Russie… grrrr !
      Le blocage via .htaccess fonctionne lorsque le robot contact le site. Et nous avons effectivement affaire à ce genre de spam parfois.
      J’ai rencontré certains webmaster qui préfèrent ne rien faire et laisser les choses dans l’état, partant du principe que leurs sites sont à jour et très bien protégés. D’autres qui surveillent les nouveaux spams et les bloquent manuellement. Mais cela nécessite un travail régulier, qui peut parfois prendre du temps selon le trafic sur le site.

Laisser un commentaire

- auction1 - price2