La récente fuite de données de Google a secoué la communauté SEO, révélant des informations potentiellement importantes sur les algorithmes de classement. Google a enfin répondu, minimisant l'importance de la fuite, tandis que plusieurs SEO américains expriment des doutes sur la véracité et l'actualité des données divulguées.
Ce qu'il faut retenir :
- Google affirme que les documents divulgués manquent de contexte et sont obsolètes ;
- Google maintient sa politique de non-commentaire sur les détails spécifiques des algorithmes de classement ;
- La communauté SEO est divisée, certains doutant de l'authenticité et de la pertinence des fuites ;
- Des experts SEO mettent en garde contre les conclusions hâtives basées sur ces informations.
La réponse de Google face au Google Leak
En réponse à la fuite des 2500 documents internes de l’équipe de recherche Google, la firme a pris le parti de minimiser leur importance en affirmant qu'ils manquent de contexte et sont obsolètes.
Un porte-parole de Google a déclaré que de nombreuses hypothèses basées sur ces données sont incorrectes et que les signaux de classement évoluent constamment, même si les principes fondamentaux du classement restent inchangés.
En refusant de commenter les détails spécifiques des documents, Google prétend protéger l'intégrité de ses résultats de recherche contre toute manipulation malveillante. Cependant, cette position sert aussi à maintenir une opacité qui profite avant tout à l'entreprise elle-même.
Les doutes des SEO américains au sujet du Google Leak
Parmi les experts SEO, de nombreux sceptiques ont récemment fait entendre leur voix concernant la validité et l'actualité des documents divulgués. Pedro Dias, un ex-Googler, et Ryan Jones, ont exprimé des réserves sur la crédibilité des fuites. Ils incitent les SEO à ne pas tirer de conclusions hâtives sans une analyse approfondie et contextuelle des informations.
While I think transparency is a good thing. Consider a healthy approach to data leaks:
— Pedro Dias (@pedrodias) May 28, 2024
- Question use
- Account for the absence context
In a nutshell: Inform yourself, but don't blindly follow anyone's take just because it's a complex topic.
Thanks for the disclaimer, Mike! https://t.co/5qjUIazBB0
“Même si je pense que la transparence est une bonne chose. Envisagez une approche saine face aux fuites de données :
- Utilisation de questions
- Prise en compte du contexte d'absence
En un mot : informez-vous, mais ne suivez pas aveuglément le point de vue de qui que ce soit simplement parce qu'il s'agit d'un sujet complexe.
Merci pour l'avertissement, Mike!”
My take on the leaked docs.
— Ryan Jones (@RyanJones) May 28, 2024
We don’t know if this is for production or for testing. My guess is it’s mostly for testing potential changes.
We don’t know what’s used for web or for other verticals. Some things might only be used for a Google home or news etc.
We don’t know…
“Mon point de vue sur les documents divulgués.
Nous ne savons pas si c’est pour la production ou pour les tests. Je suppose que c'est principalement pour tester des changements potentiels.
Nous ne savons pas ce qui est utilisé pour le Web ou pour d’autres verticales. Certaines choses peuvent uniquement être utilisées pour un accueil Google ou des actualités, etc.
Nous ne savons pas ce qu’est une entrée dans un algorithme ML et contre quoi on s’entraîne. Je suppose que les clics ne sont pas une entrée directe mais sont utilisés pour entraîner un modèle à prédire la cliquabilité. (en dehors des boosts de tendances)
Je suppose également que certains de ces champs s'appliquent uniquement aux ensembles de données de formation et non à tous les sites.
Suis-je en train de dire que Google n'a pas menti ? Pas du tout. Mais examinons cette fuite de manière répréhensible et sans biais préconçus.”
Trevor Stolber va même plus loin, affirmant que ce sont simplement des données de code obsolètes et une distraction de la part de Google face au lancement des AI Overviews dans un post LinkedIn :
“Comme la plupart des référenceurs, j’ai lu des informations sur la fuite de la documentation Google.
J’ai une opinion légèrement différente de celle que la plupart semblent avoir et je la partage.
Voici quelques observations que j'ai faites;
1) Il s'agit d'une base de code obsolète (toujours très intéressante - mais ancienne et non utilisée)
2) Cela ne vient pas réellement de leur algorithme de classement, c'est une API utilisée en interne
3) Nous connaissions déjà la plupart des choses qui s’y trouvent
4) Il existe de nombreuses informations publiques qui confirment certaines des choses ici
5) Vous devez remettre en question le timing – Google avait besoin d'une distraction
6) Pour moi, cela ressemble beaucoup à la fuite de Yandex
7) Je ne pense pas que vous auriez une variable pour les bons clics et les mauvais clics, vous auriez une valeur pour une variable appelée clics que l'évaluateur indiquerait bon ou mauvais
8) Une bonne documentation du code de production spécifierait des plages et des valeurs - je ne vois rien de tout cela ici
9) Google n'utilise pas le DA (Domain Authority) - DA est un analogue du PR (Page Rank) qui était le différenciateur remarquable de Google - je ne sais pas pourquoi tant d'attention est accordée à ces nuances.
10) Je n’y crois pas !”
Alors, que penser de ce Google Leak ? Véritables informations utiles pour améliorer vos pratiques SEO ? Ou informations potentiellement obsolètes à prendre avec des pincettes ?
Des réactions comme celles de Trevor Stolber me font marrer, car faites de contradictions (il dit d’une part que les éléments divulgués ne font pas partie de l’algorithme mais d’autre part qu’ils étaient connus et publics).
Dire en outre que Google avait besoin actuellement d’une distraction (et donc faire croire que les fuites auraient été orchestrées par Google) est complètement ridicule.
L’essentiel est que Google n’a pas nié que les documents qui ont « fuité » proviennent bien de chez eux et donc qu’ils sont réels.
Qu’ils soient incomplets, hors contexte, et partiellement obsolètes (pas nécessairement sur l’essentiel) ne change rien à leur valeur DU MOMENT où ne leur fait PAS dire autre chose que ce qu’ils contiennent.
Parmi les choses à retenir, ces documents donnent un éclairage supplémentaire entre autres sur :
1. sur la propension de Google à « privilégier » les sites qui ont « pignon sur rue » (et donc de décourager les petits sites de bénévoles ou passionnés).
2. la façon dont google analyse le comportement de ses utilisateurs face aux résultats des requêtes, ce qui est un élément essentiel de son fonctionnement et de ses performances.
Bonjour Joseph,
A titre personnel je suis complètement d’accord, je ne suis pas certaine qu’il s’agisse d’une distraction. C’est plutôt un « bad buzz » sur un autre bad buzz… Certes on parle peut-être un peu moins des AI Overviews, mais Google s’est exprimé dessus pas plus tard qu’hier alors… Ils auraient une très mauvaise façon de tirer parti de leur distraction !
Je partage le point de vue de Trevor. Avec le scandale que les AI Overviews sont en train de provoquer aux US, Google avait besoin de distraction. À mon avis, je trouve ça bizarre qu’une firme d’une telle ampleur ait subi une fuite de données pareille. C’est très louche.