Il y a quelques jours, on vous a partagé l’échange entre 404media et Danny Sullivan. Le premier affirmait que Google boostait le contenu dupliqué généré par IA, et Sullivan expliquait que le contenu sur Google News était classé selon sa récence, sa qualité ou sa pertinence. Comment Google choisit-il un article plutôt qu’un autre ?

Ce qu'il faut retenir :

  • Les articles récents et pertinents, même générés par IA, peuvent être privilégiés par Google ; 
  • L'âge du domaine et les backlinks influencent le classement, indépendamment de l'originalité du contenu ; 
  • L'accès des crawlers et l'utilisation de l'API Topics par Google sont nécessaires pour le référencement.

Contexte

Le 18 janvier, Jason Koebler de 404media a partagé un article sur X, affirmant que Google News indexait et mettait davantage en avant les articles générés par IA et dupliqués d’articles journalistiques, ceux-ci n’étant parfois même pas acceptés sur Google Actualités - comme son site.

Danny Sullivan avait apporté une réponse, clarifiant le fait que Google News ne favorisait pas spécifiquement le contenu IA mais qu’il s’agissait d’un mode de production comme un autre, l’important étant la pertinence et la récence du contenu.

Pourquoi un article d’actualité se classe-t-il bien dans la recherche ?

Récence

Google favorise les articles récents dans ses résultats de recherche, une tendance qui peut avantager le contenu généré par IA, notamment lorsqu'il est plus récent que les sources originales. Quand les contenus sont triés par date, le contenu IA peut dépasser les autres contenus journalistiques. 

Backlinks et historique de domaine

L'âge du domaine et le nombre de backlinks sont des indicateurs d'autorité pour Google. Des sites avec un historique de domaine plus important que les autres et un nombre élevé de backlinks peuvent se classer plus haut, même si leur contenu est moins original ou généré par IA. La force et l'ancienneté d'un domaine peuvent parfois prévaloir sur la qualité du contenu.

Pertinence

Quand les résultats ne sont pas triés par date, c’est la pertinence qui prévaut. Cependant, comme l’avait déjà souligné John Mueller, il est possible que le contenu syndiqué surpasse les sources originales du fait du contexte entourant l’article. 

Exemple avec la requête “nfl streaming live”, avec un article de Yahoo Entertainment mis en avant alors qu’il provient du magazine Rolling Stone. Mais parce que l’article de Yahoo est mieux optimisé autour du sport, c’est cette version qui a été privilégiée par Google. 

Accessibilité aux robots

La facilité d'accès des crawlers de Google au contenu d'un site est nécessaire pour le référencement, même s’il est protégé par paywall. A vérifier tout simplement avec une recherche “site:” ! 

L’API “Topics”

Cette API enregistre les centres d'intérêt de l'utilisateur selon son activité de navigation, et pourrait également influencer le classement d'un site dans les résultats de recherche. Bien que cette API soit principalement conçue pour le ciblage publicitaire, on peut se demander si le classement d’un site affecte son placement auprès de sites similaires dans Google Actualités.

L’auteur ?

On pourrait le penser, mais d’après Danny Sullivan les bios auteur ne rentrent pas dans les facteurs de classement de Google. En revanche, on ne peut que vous conseiller de signer vos articles, pour des questions d’EEAT.

Comment surpasser vos concurrents ?

  1. Résolvez vos problèmes techniques affectant votre indexation ; 
  2. Créez des liens internes pertinents et contextuels ; 
  3. Evitez les liens vers des sites concurrents ; 
  4. Demandez des backlinks aux sites utilisant vos contenus originaux.