Ce qu'il faut retenir :

  • Plus de 1 000 sites francophones générés par intelligence artificielle ont été recensés par Next & Libération, utilisant des techniques SEO pour capter l’audience et les revenus publicitaires.
  • Les journalistes dénoncent des pratiques nuisant aux médias traditionnels par le détournement de leur trafic et l'exploitation de contenus parfois non sourcés ou plagiés.
  • Les éditeurs dénoncent l'hypocrisie des rédactions : elle utilisent l'IA et l'automatisation pour investir des espaces en dehors de leurs lignes éditoriales tout en reprochant ces pratiques aux autres.

L'avis tranché des journalistes : les médias full-IA polluent le web

Le 6 février 2025, les médias Next et Libération ont publié deux articles, faisant suite à plusieurs mois d'enquête sur des médias francophones générés par IA, visiblement au nombre de 1000 et quelques : "un recensement forcément non exhaustif". Le postulat du journaliste Jean-Marc Manach, à l'origine de l'enquête : ces "faux" médias polluent le web et Google, prenant la place des "vrais" médias (comprendre : traditionnels) en les copiant et en les plagiant.

"Une nouvelle ruée vers l’or se déroule sur Internet. Des entrepreneurs rusés, profitant des coûts dérisoires et des performances de l’intelligence artificielle générative, inondent actuellement le web de petits «sites d’actualités» où sont publiés, de manière automatisée, des contenus tantôt paraphrasés, tantôt plagiés, quand ils ne sont pas simplement inventés." - Libération

Cette apparition d'une multitude de sites médias inquiète fortement la presse dite "traditionnelle". En effet, ces sites sont vraisemblablement créés par des référenceurs professionnels (ayant donc une meilleure compréhension que les journalistes du fonctionnement des moteurs de recherche). Ces entrepreneurs ne cherchent pas à partager de l'information mais à seulement tirer profit des bénéfices issus de leur trafic Google Discover (affiliation, vente de liens, etc.).

Une concurrence jugée déloyale par les journalistes des médias traditionnels, considérant ces sites comme des "parasites" (d'après Florent Rimbert, responsable du pôle développement numérique de l'Apig), volant une partie de leurs revenus et trafic :

"L’ampleur du manque à gagner est actuellement difficile à estimer. Si la majorité des sites fantoches identifiés dans le cadre de cette enquête semblent générer peu de trafic, une vingtaine de plateformes francophones engrangent chaque mois les clics des dizaines de milliers de visiteurs – des proportions qui rivalisent, voire surpassent, certains petits acteurs de la presse française." - Libération

Cette concurrence déloyale est aussi vecteur de désinformation selon les journalistes : en cumulant faux profils de rédacteurs et hallucinations des IA, certains sites ont diffusé de fausses informations. Il citent "Boris", un éditeur interviewé pendant leur enquête : «L’an dernier, s’amuse Boris, l’un de mes sites a mis en avant, photo à l’appui, une manifestation annuelle… qui ne s’était pas tenue depuis 2006. La maire de la ville concernée nous a contactés, en nous demandant comment il était possible que nous mettions en avant une photo d’un événement qui n’existait pas. Nous avons supprimé dans la foulée…»

Ces sites sont d'ailleurs mentionnés comme "sources" au sein même de Wikipédia :

"Nous leur avons depuis transmis à la liste des 1 066 sites GenAI identifiés à ce jour : 443 sont mentionnés comme « sources » et notes de bas de page sur Wikipédia, soit plus de 40 % du total. La liste de ces noms de domaine va désormais permettre aux contributeurs de l'encyclopédie de vérifier combien peuvent légitimement continuer à y figurer, ou pas (nous y reviendrons)." - Next

Mais cette guerre va plus loin qu'une simple opposition entre deux formes de rédaction - l'une journalistique, et l'autre IA. Jean-Marc Manach et Libération ont été jusqu'à contacter Google, pour leur fournir une liste des sites qu'ils avaient détecté comme générés par IA, attendant que la firme fasse un grand ménage dans les sites mis en avant :

"Il aura cependant fallu que nous lui [porte-parole de Google] mentionnions quelques sites repérés par Next et Libé dans le cadre de cette enquête pour que la modération s’opère." - Libération

Qu'en pensent les éditeurs de médias IA ?

Comme on s'en doute, cette enquête n'a pas été bien accueillie par les éditeurs de sites et les SEO. Interviewés à l'occasion de l'enquête de Libération, les éditeurs se défendent :

"Ce sont les médias traditionnels qui, les premiers, sont venus nous concurrencer sur nos métiers», s’agace un entrepreneur. Nombreux sont ceux qui citent le cas des articles de comparatifs conso, autrefois pré carré des petits éditeurs web, qui sont désormais publiés par des journaux et magazines établis, assumant même de toucher une commission sur certains liens. Du côté de Tremplin numérique, on va même plus loin : «On nous reproche de la paraphrase sans citation ? Mais les journaux le font chaque jour entre eux ! Il y a zéro plus-value journalistique là-dedans, mais les personnes dont le métier se résume à ça, dans les rédactions, ont quand même le droit à leur carte de presse.» Et d’enfoncer le clou : «Notre contenu n’apporte rien, et le leur non plus, mais nous, on l’assume". - Libération

Sur X (Twitter), d'autres ont pris la parole suite au thread publié par Jean-Marc Manach, relevant l'hypocrisie des journalistes et le fait que de nombreux médias utilisaient déjà l'IA pour générer du contenu avant les éditeurs de sites :

La réponse de Clément Pessaux, éditeur et référenceur, qui vaut le détour

Clément Pessaux, expert Discover et SEO de longue date, a rédigé un article sur LinkedIn où il répond, point par point, aux différentes affirmations de Libération. Une réponse structurée et argumentée qui mérite d'être lue, que l'on soit d'accord ou non avec son propos.

Il aborde, notamment, la "mauvaise utilisation" du terme de concurrence déloyale, car l'audience des sites médias IA est insignifiante par rapport à celle des médias traditionnels, sans considérer la surproduction d'articles :

"Quand on parle de concurrence déloyale, c'est dans les faits une erreur flagrante, car il ne faut pas confondre le volume de production d'info via l'IA (les GenIA) et l'information visible ou lue. L'audience des sites IA sur l'actualité "pure" est totalement marginale. Voir un site produire 6000 articles par jour d'actualité est sans aucun doute problématique, mais si son audience est marginale le problème par essence n'existe pas. Il devient le bouc émissaire facile et caricatural alors que son impact réel est proche de zéro." - Clément Pessaux

Il continue en rappelant que l'information n'est plus exclusivement entre les mains des journalistes :

"[...] La gestion de l'actualité pour être valide doit passer par un journaliste sans quoi la légitimité et la crédibilité seront remises en cause. Il n'y a donc aucun "contre-pouvoir" ? Je ne vais pas nécessairement tomber dans la pensée de Gustave Le Bon (La psychologie des foules) et sa vision de la presse, lui qui considérait la presse comme un puissant outil de manipulation. Mais l'information, la communication, n'est pas l'apanage des journalistes, je trouve toujours dangereux ce discours qui pose le journalisme comme gardien du temple de certaines vérités (et l'article de Libération et celui de Next plongent dans ce travers) qui est lié avec le point suivant."

En conclusion, Clément reconnaît que la génération de contenu IA peut poser problème, mais que la presse a bien d'autres problèmes - plus importants - que lutter contre ces éditeurs :

"Je ne vais pas nier qu'il y a une vraie problématique au niveau de la génération de contenu d'actualité avec de l'IA. Cela pose des problèmes au niveau des droits d'auteur, c'est un fait et c'est même indéniable. Et oui, une certaine presse peut disparaître si et seulement si elle n'évolue pas et ce ne sera en aucun cas la faute de l'IA ou de quelques sites majoritairement insignifiants qui changeront quelque chose. J’en veux pour exemple un autre article “Quarante médias saisissent la justice pour bloquer «News DayFr», un des multiples «sites parasites» générés par IA” sur le fond on peut comprendre la démarche au vu du volume de contenu généré, sur la forme on parle ici d’un site qui fait 100K de trafic mensuel pour des revenus que l’on peut estimer, sans trop se tromper, à 300€ par mois. Il faut avoir des ennemis à la hauteur du conflit et ici ce n’est clairement pas le cas." - Clément Pessaux

Que penser de l'affaire ?

Nous choisissons de donner un droit de réponse aux référenceurs car il est important d'ouvrir ces débats : la place de l'IA dans l'édition, le risque de désinformation et la pérennité des médias (on vous conseille de lire également les commentaires sur l'article LinkedIn de Clément).

Chez Abondance, nous utilisons ChatGPT, Perplexity et Claude. L'IA est un outil, ce qu'on en fait relève de notre responsabilité. Si vous continuez à nous lire, c'est parce que nos articles sont utiles et pertinents. La valeur ne réside pas dans l'information mais dans la plus-value de l'éditeur.

Finalement, ce qui anime ce débat entre journalistes et éditeurs anime tous les référenceurs : comment me distinguer de mes concurrents ? comment apporter plus de valeur que les autres ? quel angle nouveau apporter à mes contenus ? comment inspirer confiance ? Abonnez-vous aux médias que vous estimez être de valeur. Chillez sur Discover. Développez votre esprit critique quand vous consommez un contenu. Bref, faites ce que vous voulez finalement. Nous, on continuera d'écrire des articles qui vous aident à apprendre le SEO.