Google vient de mettre à jour les consignes données à ses "Quality Raters" au sein de sa documentation. Un must-read pour chaque référenceur. 11 nouvelles pages viennent densifier le document de 181 pages. Découvrez les nouvelles consignes et les modifications majeures relevées par Abondance.
Ce qu'il faut retenir :
- Google a mis à jour les Quality raters Guidelines le 23 janvier 2025. La dernière mise à jour datait du 5 mars 2024.
- Les consignes anti-spam sont de plus en plus précises et Google intègre des consignes en lien avec ses récentes mises à jour (parasite SEO, abus de domaines expiré).
- Google définit, dans diverses sections, ce qu'est un "bon contenu" selon lui, afin d'aider les Quality Raters à identifier les générations massives de contenus sans relecture.
Evolution #1 : ajout de la définition de l'IA Générative
Partie : 2.1 Important Definitions (page 10)
Google a ajouté une définition de l'IA générative. En français : "L'IA générative est un type de LLM qui peut utiliser ce qu'il a appris, à partir d'exemples, pour créer un nouveau contenu : texte, image, musique et code. Différents outils exploitent ces LLM. L'IA générative peut être un outil utile de création de contenu, mais comme tout outil, peut être utilisée à mauvais escient."
Alors que Google autorise bien évidemment la rédaction assistée par IA, le moteur de recherche renforce la vigilance de ses "Raters" en leur rappelant que le web est constitué de contenus également générés par des machines. On pense bien évidemment aux deepfakes mais aussi aux contenus générés en masse, sans relecture, pouvant colporter des informations non sourcées ou non vérifiées.
Evolution #2 : précisions sur les contenus de faible qualité
Partie : 4.0 Lowest Quality Pages (pages 29 et 30)
Deux nouveaux exemples de ce qu'est un contenu de faible qualité :
Un contenu est de faible qualité s'il est créé uniquement pour générer des revenus à l'éditeur sans prise en compte de la valeur ajoutée pour le lecteur :
Un contenu est de faible qualité s'il a été créé avec très peu d'effort ou s'il n'apporte aucune plus-value, comparativement aux autres pages trouvées sur le web :
Là encore, Google adapte ses consignes aux Quality Raters, pour leur rappeler les mauvaises pratiques que la team anti-spam combat.
Evolution #3 : renforcement des consignes sur les pratiques trompeuses
Partie : 4.5.3 Deceptive Page Purpose, Deceptive Information about the Website, Deceptive Design (pages 36 à 38)
La partie initialement appelée "4.5.3 Deceptive Page Purpose and Deceptive Design" s'enrichit de consignes quant au contenu déceptif. Ci-dessous, le nouveau tableau et les nouvelles définitions qui ont fait leur apparition :
Alors que la version initiale portait sur l'usurpation d'identité, les contenus putaclic et la publicité déguisée, Google enrichit largement cette partie avec des consignes sur les pratiques trompeuses au sens large :
- les pratiques publicitaires trompeuses dans le but de générer des ventes affiliées sans vérification des informations sur un produit ou un service (promotion d'un produit sans l'avoir testé, par exemple) ;
- les entreprises faisant croire à une présence physique (fausse adresse, fausses photos) alors que le business est 100% en ligne ;
- les faux auteurs créés dans le but de faire croire à un auteur humain alors que le contenu est généré par IA ;
- les mensonges quant à l'expertise réelle de l'auteur (certifications, diplômes) pour faire paraitre le contenu comme une source d'info de confiance.
Côté expérience utilisateur, Google détaille également ce qu'il entend par "pratique trompeuse" : des liens ou boutons menant à des actions différentes ce que qu'elles laissent paraître ("X" pour fermer une pop-up qui est en fait le téléchargement d'une app).
Evolution #4 : quatre nouvelles sections dédiées au Spam
Partie : 4.6 Spammy Webpages (pages 39 à 42)
La Section s'enrichit de 4 nouvelles sections :
- 4.6.3 Expired Domain Abuse : traite de l'abus des domaines expirés ;
- 4.6.4 Site Reputation Abuse : aborde l'abus de la réputation des sites ;
- 4.6.5 Scaled Content Abuse : évoque l'abus du contenu à grande échelle ;
- 4.6.6 No Effort, No Originality, No Added Value : traite des contenus copiés ou à faible valeur ajoutée.
Concernant l'abus de domaines expirés : Google explique que certains domaines expirés, auparavant de forte autorité comme un site gouvernemental ou éducatif, peuvent être détournés dans le but de pousser des contenus sans rapport avec le nom ou la réputation du site avant l'expiration de son nom de domaine. Il cite, en exemple, du contenu "pari en ligne" sur le nom de domaine d'un site qui était autrefois une école.
L'abus de réputation (ou "parasite SEO"), utilise la puissance d'un site d'autorité pour diffuser du contenu tiers ou de faible qualité dans le but de se référencer. On l'a d'ailleurs vu cette semaine avec la chute massive de positionnement des sites médias sur les requêtes "code promo". Les pénalités tombent, Google aligne ses consignes aux Quality Raters sur les annonces de 2024.
L'abus de contenu produit à grande échelle concerne uniquement la publication massive de contenus, sans retouches manuelle ni vérification des sources, dans le but de manipuler le classement de la recherche. Cette nouvelle consigne s'aligne sur les consignes anti-spam bien connues de Google.
La création de contenu sans valeur ajoutée s'adresse aux contenus dont la majeure partie est scrapée, volée, générée par IA sans valeur ajoutée, paraphrasée en majeur partie ou embarquée. Et cela que l'on parle de texte, image, audio ou vidéo, quand bien même l'auteur est crédité. Je vous laisse le plaisir de lire les exemples et les définitions de Google quant à la paraphrase et ce qu'il considère comme "peu de valeur ajoutée" (liens des PDF dans les sources en fin d'article).
Evolution #4 : la lutte contre le remplissage
Parties : 5.2.1 MC is Created with Low Effort, Low Originality and Low Added Value for Website Visitors (page 60) et 5.2.2 Filler as a Poor User Experience (page 61)
Google rappelle la définition de contenu de qualité comme vu précédemment dans notre article. En complément, la section "Filler as a Poor User Experience" est intéressante à deux titres :
- Google indique le contenu le plus utile doit être placé en haut de page ("Web site owners and content creators should place the most helpful and essential MC near the top of the page so that visitors can immediately access it").
- Google donne des consignes pour aider les Quality Raters à débusquer le contenu "de remplissage" : soit un contenu avec une faible valeur ajoutée, créant une page artificiellement dense mais manquant de fond ("Filler can artificially inflate content, creating a page that appears rich but lacks content website visitors find valuable").
Et maintenant ?
Google travaille dur à définir ce qu'est un "bon contenu" et il va sans dire que l'arrivée des IA génératives a fortement impacté ses politiques anti-spam. Le moteur de recherche affine et illustre de plus en plus ses consignes afin d'aider les Raters à séparer le bon grain de l'ivraie.
Chers amis référenceurs, l'heure est à la concision et l'authenticité ! Evitez la suroptimisation, concentrez-vous sur votre valeur ajoutée en réfléchissant à ce qui distingue votre contenu de celui de vos concurrents, et évitez de le remplir inutilement vos pages de gros paragraphes (que personne ne lit de toute manière).