Google News a récemment été critiqué pour promouvoir du contenu généré par IA, au détriment du journalisme traditionnel. Danny Sullivan de Google répond à ces allégations, soulignant les défis et les politiques de Google en matière de filtrage de contenu.
Ce qu'il faut retenir :
- Jason Koebler, de 404 Media, a signalé sur X que Google News indexe et met en avant des sites utilisant des clones d'articles générés par IA, alors que des sites avec du contenu rédigé par de vrais journalistes sont négligés ;
- Danny Sullivan, de Google, a clarifié que Google News ne favorise pas spécifiquement le contenu IA et que la qualité du contenu reste une priorité, indépendamment de la méthode de production ;
- Sullivan a également abordé le problème de l'indexation des nouveaux sites d'information, reconnaissant la nécessité d'améliorer ce processus.
Google News et la controverse du contenu IA
Jason Koebler a exprimé sa frustration sur X (Twitter) concernant la façon dont Google Actualités indexe et met en avant des sites qui copient des articles via des clones générés par IA, tout en négligeant des sites avec du journalisme “humain”.
Google News is indexing and promoting websites that immediately rip off others with AI clones of their articles. These websites are absolutely littered with Google ads. Our website, in which real humans do journalism, is not indexed by Google Newshttps://t.co/0mshx4sQgs
— Jason Koebler (@jason_koebler) January 18, 2024
Il poursuit avec un exemple de site présent dans Google Actualités, avec un auteur publiant 40 articles en moins de 24h, des fautes de copie dans certains articles (l’IA écrivant une autre version de l’article d’origine), etc.
La réponse de Google
Danny Sullivan, aka Google Search Liaison, a répondu aux critiques. Il explique notamment que Google “ne booste pas d’une manière ou d’une autre le contenu IA en haut des résultats de recherche”.
Jason, I’d like to clarify Google News is not somehow “boosting” AI content to the top of search results. This is not the case. I also appreciate the frustration of a new publication like yours wanting to quickly appear in Google News. I do. It’s something I hope we’ll improve…
— Google SearchLiaison (@searchliaison) January 19, 2024
Il relève cependant que sur les captures d’écran partagées, le contenu est trié par date et non pas pertinence, ce qui revient à demander aux systèmes d’ignorer le classement de pertinence régulier qu’ils effectuent, y compris les évaluations de qualité, et d’afficher le contenu le plus récent.
In particular, it’s possible to use the News tab on Google Search to show news-related content sorted by date, as opposed to by relevance. That’s what was done with the screenshots. Doing this is expressingly asking our systems to ignore the regular relevance ranking that they…
— Google SearchLiaison (@searchliaison) January 19, 2024
Danny Sullivan est toutefois d’accord pour dire qu’aucun système automatisé n’est parfait, et que les systèmes de classement par défaut de Google Actualités pourraient afficher du contenu de qualité inférieure.
Défi pour les nouveaux sites d'information
Sullivan a reconnu que les nouveaux sites d'information, comme celui de Koebler, peuvent avoir du mal à apparaître rapidement dans Google Actualités (l’auteur se plaignait en effet que contrairement à ces sites, lui n’était pas accepté dans Google News).
Il a admis que "les systèmes de Google peuvent mettre du temps à reconnaître et faire apparaître le contenu provenant de nouvelles publications", mais a assuré que "Google cherche à améliorer ce processus".
As for your content appearing in Google News, it can simply take time for our systems to recognize and surface material from new publications. The systems tend to want to see some period of news publishing over time, which I hope is understandable. That said, we’ll look to see if…
— Google SearchLiaison (@searchliaison) January 19, 2024
Il encourage néanmoins Jason Koebler à octroyer un accès aux robots d’exploration de Google, étant donné que le contenu de 404 media est bloqué par un paywall. Peut-être qu’une fois que Google pourra comprendre le travail effectué par ce média, il sera accepté dans Google News.
Importance de la qualité du contenu
La position de Google reste claire : “Concernant l’utilisation de l’IA pour générer du contenu, comme nous l’avons déjà expliqué, nous nous concentrons sur la qualité du contenu, pas le mode de production. Cela ne doit pas être interprété comme un laissez-passer pour produire de nombreux contenus de mauvaise qualité”.
As for the use of AI to generate content, as we’ve explained before, our focus is on the quality of content, not the production. This shouldn’t be misinterpreted as if we’ve granted a free pass to churning out lots of low quality content. It is not and doing so is against our…
— Google SearchLiaison (@searchliaison) January 19, 2024
Cette situation met en avant les défis auxquels Google Actualités est confronté actuellement, devant équilibrer le respect du journalisme traditionnel et les publications générées par intelligence artificielle.
L'avis de Clément Pessaux
[edit 22/01/2024]
Suite à la publication de cet article, Clément Pessaux, consultant SEO et notamment expert Google News, nous a partagé son avis sur cette affaire.
"Il faut être clair sur ce sujet : aujourd'hui, 90 % des contenus d'actu disponibles sur le web sont créés par les agences de presse. Tous les plus grands médias se basent sur cette data. Derrière cela, on trouve une batterie de pigistes qui vont réécrire ces dépêches ; il n'y a, sur la forme et le fond, aucune différence avec de la réécriture via IA. Alors oui, de cette manière, on peut produire des centaines d'articles par jour à moindre coût.
La différence entre certains grands médias établis et la génération de sites d'actu créés par IA est faible. L'IA est un défi pour les journalistes qui doivent non pas la critiquer en mode 'bête et méchant', mais la considérer comme une opportunité de devenir des 'journalistes augmentés'.
Il peut être facile d'accuser Google et d'autres sites pour masquer ses faiblesses ou ses manquements techniques et éditoriaux, alors que certains éditeurs ne respectent pas les guidelines de Google News. Par exemple, des problèmes techniques majeurs, des problèmes d'indexation, un site trop récent, pas de sitemap news, un contenu hétérogène et hors actu, etc."
Et vous, quel est votre avis sur la question ?