Google vient d'annoncer, au détour d'une conversation sur Twitter, que le moteur de recherche ne prenait plus en compte les balises de pagination qu'il avait pourtant mis en place en 2011, provoquant une grogne générale chez de nombreux acteurs. Une colère compréhensible devant le manque de respect du moteur de recherche à cette occasion...
En septembre 2011, Google mettait en place des balises de pagination (rel="prev" et rel="next") pour indiquer, dans un contenu paginé la page précédente et la page suivante dans une liste. A noter que, quelques mois plus tard, Bing lui emboîtait le pas en les prenant en compte à son tour.
Et puis, voilà qu'on apprend, au fil d'une discussion sur Twitter et par la voix (ou le clavier) de John Mueller, que non seulement Google ne prend plus en compte ces balises, mais qu'en plus c'est le cas depuis "quelques années".
Le fait de les intégrer dans le code HTML des pages d'un site web n'est cependant pas totalement inutile, puisque Bing (comme il vient de le rappeler sur Twitter) les lit encore. Mais pour Google, elles sont donc inutiles aujourd'hui.
Un manque de considération de la part de Google qui provoque une grogne généralisée
Alors, bien sûr, on pourra toujours dire que ce n'était qu'un complément technique à la mise en place d'une pagination bien conçue par ailleurs, mais :
- De nombreux outils (CMS, outils de crawl) les ont implémentées depuis des années ;
- De nombreux webmasters les ont également mises en place, spécifiquement pour Google ;
- Tout SEO sérieux a proposé cette implémentation à ses clients si ces balises n'étaient pas présentes ;
- Etc.
Et tout ça finalement pour rien… Que d'énergie inutilement dépensée...
Ce qui est le plus navrant dans tout ça, ce n'est pas vraiment l'abandon de ces balises (on survivra sans problème à leur abandon et cela ne nous empêchera pas de concevoir des contenus paginés de bonne qualité), mais c'est surtout le manque de respect de Google pour tous les webmasters, concepteurs d'outils et référenceurs, en créant des fonctionnalités (utiles, qui plus est) puis en les abandonnant sans aucune communication officielle, sans un mot autre qu'au détour d'une conversation a priori anodine. Et qu'en est-il du scroll infini, pour lequel les recommandations tenaient compte de ces balises ? A quoi cela sert donc d'intégrer des recommandations officielles si on apprend "par la bande" un peu plus tard qu'elles ne sont pas ou plus prises en considération ? On en vient ainsi à douter d'une façon globale de TOUTE la communication de Google...
C'est ce manque total de respect envers des gens qui bossent dur pour créer des sites "SEO friendly" et techniquement de bonne qualité qui énerve aujourd'hui de nombreuses personnes et qui explique certainement la grogne de la communauté. Si ces balises ont été implémentées, si on a fait ce travail et investi des heures/hommes à les mettre en place, c'était avant tout pour que Google (et les autres moteurs) "comprennent" mieux les contenus paginés. Et cela aurait certainement mérité un peu plus de considération de la part des personnes de Mountain View…
A noter d'ailleurs que dans son hangout du 19 mars dernier, Google recommandait toujours d'utiliser ces balises de pagination, pourtant (si on a bien suivi) abandonnées depuis plusieurs années. Qui s'occupe de la communication SEO à Mountain View ?
Allez vous étonner ensuite que certains privilégient le black hat quand on voit comment leurs efforts pour faire du travail propre sont traités et considérés...
We don't use link-rel-next/prev at all.
— 🍌 John 🍌 (@JohnMu) 21 mars 2019
Le tweet de John Mueller indiquant que Google n'utilise plus les balises de pagination. Source : Twitter
Plus utile sur Google, peut être, mais n’oublions pas les 3% restants qui sont sur bing !
Oui, nous aussi, on a passé du temps à implémenter la pagination chez notre meilleur client e-commerce, il y a 1 an… ça nous fait une belle jambe :-0
Le bon côté de l’histoire, à mes yeux, c’est que les failles et les décisions fragiles de Google ouvrent chaque fois légèrement la porte (qui sait?) à un retour des moteurs de recherche alternatifs. En soi, économiquement, stratégiquement et moralement, c’est inconséquent de dépendre de ce seul moteur.
Aujourd’hui google met de côtés les balise prev et next mais qui nous dit que dans quelques temps celle si ne ferait pas leur retour, je ne comprends pas trop la démarche de google pour le coup, c’est balise amené vraiment en plus en terme de structure et donner une réeele information en terme de pagination pour les robots.
J’ai eu passé un temps de dingue pour faire comprendre cela à certains pour leur site de type e-commerce, aujourd’hui on passe un peu pour des …
Voilà exactement pourquoi j’ai quitté le SEO pour retourner au dev. On est la pelote de laine du chat Google.
Pour revenir sur le commentaire du DC, je pense que les balises prev/next sont souvent associées à ce problème car en général, une pagination va potentiellement généré beaucoup de contenu dupliqué proche si on utilise un texte optimisé qui va se retrouver sur toutes les pages.
C’est souvent le cas sur les sites e-commerce où un texte est rédigé pour chaque catégorie et affiché sur l’ensemble des pages faisant partie d’un même cluster de pagination.
Concernant l’annonce de John Mueller, la page n’est plus disponible chez Google mais si on regarde sur webarchive, le premier conseil indiqué était de ne rien faire en ce qui concerne la pagination :
http://web.archive.org/web/20180125083221/https://support.google.com/webmasters/answer/1663744
« Do nothing. Paginated content is very common, and Google does a good job returning the most relevant results to users, regardless of whether content is divided into multiple pages. »
En ce qui me concerne, je pense que cette balise était bien trop souvent mal implémentée et comme la liaison entre les pages suivantes/page précédente doit être parfaite pour que tout le cluster de pagination soit reconnu, Google a du préférer l’abandonner et prioriser la reconnaissance « automatique » du contenu paginé (ce qui ne doit pas leur poser beaucoup de problèmes sachant qu’en général, cela fonctionne à l’aide d’un paramètre qui s’incrémente).
Cela est effectivement rageant d’apprendre que même Google ne respecte pas ses propres guidlines … Pour ma part, je pense aussi aux clients qui ont dépensés du budget, entres autres, pour ce genre d’optimisations qui au final n’en sont à priori plus depuis quelques temps du point de vu de Google.
La question qui se pose est alors de savoir si ceux qui n’ont implémenté que ces balises dans le but de palier au DC des systèmes de pagination sont potentiellement impactés par Panda.
Houla il n’y a pas de notion de DC dans Panda (https://www.abondance.com/20151016-15688-le-duplicate-content-ne-serait-pas-un-critere-panda-selon-google.html). Et ces balises ne servaient pas au DC mais plutôt au signalement de contenus paginés et donc à la possibilité d’avoir un crawl plus profond.
Bizarrement, la page d’aide Google sur ce sujet n’est plus :
https://support.google.com/webmasters/answer/1663744?hl=fr
J’ai toujours préféré la technique des balises rel canonical pour les soucis liés aux paginations et je regrette pas trop 🙂
pourquoi utiliser les « canonical » en pagination (sauf bien sûr dans le cas où il y a une page regroupant toutes les réponses sans pagination) ?
Il y a le cache MAIS (et peu de gens l’ont vu) : ce système était valable UNIQUEMENT pour les articles splittés pas pour les listes d’éléments (itemlist)
Quoi ???
On peut se poser légitimement la question de l’utilité du poste occupé par Danny Sullivan au sein de Google en tant que Search Liaison également : https://twitter.com/searchliaison
Le vrai drame c’est que le public est persuadé que Google (et les autres moteurs) sont intelligents, qu’ils apportent les résultats les plus pertinents.
Grossière erreur, ouvrez les yeux, combien de fois le « résultat pertinent » se trouve t’il en page 2 ou 3 alors que les premiers affichés ne sont que les « plus gros usuels ».
L’algorithme de Google a trop grossi est est devenu un paquebot de moins en moins efficace et qui favorise toujours plus les gros sites commerciaux qui ne sont pas toujours la réponse la plus pertinente à une recherche donnée (qui peut très bien se trouver dans une page au fin fond d’un site perso d’une qualité globale moyenne).
La pertinence de Google a baissé depuis un certain nombre d’années.
Peut-être se fera il reléguer au second rang par un disrupteur, comme Google a lui-même avalé Altavista à l’époque ?
J’ai toujours détesté ces balises natives WordPress et j’ai les ai toujours retiré via la function.php car jamais utile et pro pour générer des 404 lorsqu’une refonte de site a lieu.
Y’a énormément de chose inutile au niveau de ce genre de balise mine de rien.