Ce qu'il faut retenir :
- Plus de 1 000 sites francophones générés par intelligence artificielle ont été recensés par Next & Libération, utilisant des techniques SEO pour capter l’audience et les revenus publicitaires.
- Les journalistes dénoncent des pratiques nuisant aux médias traditionnels par le détournement de leur trafic et l'exploitation de contenus parfois non sourcés ou plagiés.
- Les éditeurs dénoncent l'hypocrisie des rédactions : elle utilisent l'IA et l'automatisation pour investir des espaces en dehors de leurs lignes éditoriales tout en reprochant ces pratiques aux autres.
L'avis tranché des journalistes : les médias full-IA polluent le web
Le 6 février 2025, les médias Next et Libération ont publié deux articles, faisant suite à plusieurs mois d'enquête sur des médias francophones générés par IA, visiblement au nombre de 1000 et quelques : "un recensement forcément non exhaustif". Le postulat du journaliste Jean-Marc Manach, à l'origine de l'enquête : ces "faux" médias polluent le web et Google, prenant la place des "vrais" médias (comprendre : traditionnels) en les copiant et en les plagiant.
"Une nouvelle ruée vers l’or se déroule sur Internet. Des entrepreneurs rusés, profitant des coûts dérisoires et des performances de l’intelligence artificielle générative, inondent actuellement le web de petits «sites d’actualités» où sont publiés, de manière automatisée, des contenus tantôt paraphrasés, tantôt plagiés, quand ils ne sont pas simplement inventés." - Libération
Cette apparition d'une multitude de sites médias inquiète fortement la presse dite "traditionnelle". En effet, ces sites sont vraisemblablement créés par des référenceurs professionnels (ayant donc une meilleure compréhension que les journalistes du fonctionnement des moteurs de recherche). Ces entrepreneurs ne cherchent pas à partager de l'information mais à seulement tirer profit des bénéfices issus de leur trafic Google Discover (affiliation, vente de liens, etc.).
Une concurrence jugée déloyale par les journalistes des médias traditionnels, considérant ces sites comme des "parasites" (d'après Florent Rimbert, responsable du pôle développement numérique de l'Apig), volant une partie de leurs revenus et trafic :
"L’ampleur du manque à gagner est actuellement difficile à estimer. Si la majorité des sites fantoches identifiés dans le cadre de cette enquête semblent générer peu de trafic, une vingtaine de plateformes francophones engrangent chaque mois les clics des dizaines de milliers de visiteurs – des proportions qui rivalisent, voire surpassent, certains petits acteurs de la presse française." - Libération
Cette concurrence déloyale est aussi vecteur de désinformation selon les journalistes : en cumulant faux profils de rédacteurs et hallucinations des IA, certains sites ont diffusé de fausses informations. Il citent "Boris", un éditeur interviewé pendant leur enquête : «L’an dernier, s’amuse Boris, l’un de mes sites a mis en avant, photo à l’appui, une manifestation annuelle… qui ne s’était pas tenue depuis 2006. La maire de la ville concernée nous a contactés, en nous demandant comment il était possible que nous mettions en avant une photo d’un événement qui n’existait pas. Nous avons supprimé dans la foulée…»
Ces sites sont d'ailleurs mentionnés comme "sources" au sein même de Wikipédia :
"Nous leur avons depuis transmis à la liste des 1 066 sites GenAI identifiés à ce jour : 443 sont mentionnés comme « sources » et notes de bas de page sur Wikipédia, soit plus de 40 % du total. La liste de ces noms de domaine va désormais permettre aux contributeurs de l'encyclopédie de vérifier combien peuvent légitimement continuer à y figurer, ou pas (nous y reviendrons)." - Next
Mais cette guerre va plus loin qu'une simple opposition entre deux formes de rédaction - l'une journalistique, et l'autre IA. Jean-Marc Manach et Libération ont été jusqu'à contacter Google, pour leur fournir une liste des sites qu'ils avaient détecté comme générés par IA, attendant que la firme fasse un grand ménage dans les sites mis en avant :
"Il aura cependant fallu que nous lui [porte-parole de Google] mentionnions quelques sites repérés par Next et Libé dans le cadre de cette enquête pour que la modération s’opère." - Libération
Qu'en pensent les éditeurs de médias IA ?
Comme on s'en doute, cette enquête n'a pas été bien accueillie par les éditeurs de sites et les SEO. Interviewés à l'occasion de l'enquête de Libération, les éditeurs se défendent :
"Ce sont les médias traditionnels qui, les premiers, sont venus nous concurrencer sur nos métiers», s’agace un entrepreneur. Nombreux sont ceux qui citent le cas des articles de comparatifs conso, autrefois pré carré des petits éditeurs web, qui sont désormais publiés par des journaux et magazines établis, assumant même de toucher une commission sur certains liens. Du côté de Tremplin numérique, on va même plus loin : «On nous reproche de la paraphrase sans citation ? Mais les journaux le font chaque jour entre eux ! Il y a zéro plus-value journalistique là-dedans, mais les personnes dont le métier se résume à ça, dans les rédactions, ont quand même le droit à leur carte de presse.» Et d’enfoncer le clou : «Notre contenu n’apporte rien, et le leur non plus, mais nous, on l’assume". - Libération
Sur X (Twitter), d'autres ont pris la parole suite au thread publié par Jean-Marc Manach, relevant l'hypocrisie des journalistes et le fait que de nombreux médias utilisaient déjà l'IA pour générer du contenu avant les éditeurs de sites :
Jeter en pature et sans discernement des éditeurs de sites, avec les conséquences dramatiques que ça peut avoir, montre l'état d'esprit lamentable d'une profession en crise profonde, qui ne survit que grâce aux subventions publiques et aux mauvaises pratiques généralisées.… https://t.co/lsJHTjWBaG
— David Chelly (@onlinestratfr) February 8, 2025
La personne qui a écrit ça connaît très peu le business web pour ne pas se rendre compte que les grands sites (e-commerce, médias, etc.) utilisaient GPT2 bien avant les petits éditeurs de sites.
— Romain Lenglet 📈 (@RLglt) February 7, 2025
Tout aussi "bassement"
Par ailleurs son extension de détection sera 100% inefficace https://t.co/Bgk4ei7Bwn
Un petit peu de vrai et BEAUCOUP d'hypocrisie, car leur réel problème, c'est qu'ils ne veulent pas partager leur gâteau. https://t.co/hnzvop2GtB
— Raphael Doucet (@RaphSEO) February 7, 2025
La réponse de Clément Pessaux, éditeur et référenceur, qui vaut le détour
Clément Pessaux, expert Discover et SEO de longue date, a rédigé un article sur LinkedIn où il répond, point par point, aux différentes affirmations de Libération. Une réponse structurée et argumentée qui mérite d'être lue, que l'on soit d'accord ou non avec son propos.
Il aborde, notamment, la "mauvaise utilisation" du terme de concurrence déloyale, car l'audience des sites médias IA est insignifiante par rapport à celle des médias traditionnels, sans considérer la surproduction d'articles :
"Quand on parle de concurrence déloyale, c'est dans les faits une erreur flagrante, car il ne faut pas confondre le volume de production d'info via l'IA (les GenIA) et l'information visible ou lue. L'audience des sites IA sur l'actualité "pure" est totalement marginale. Voir un site produire 6000 articles par jour d'actualité est sans aucun doute problématique, mais si son audience est marginale le problème par essence n'existe pas. Il devient le bouc émissaire facile et caricatural alors que son impact réel est proche de zéro." - Clément Pessaux
Il continue en rappelant que l'information n'est plus exclusivement entre les mains des journalistes :
"[...] La gestion de l'actualité pour être valide doit passer par un journaliste sans quoi la légitimité et la crédibilité seront remises en cause. Il n'y a donc aucun "contre-pouvoir" ? Je ne vais pas nécessairement tomber dans la pensée de Gustave Le Bon (La psychologie des foules) et sa vision de la presse, lui qui considérait la presse comme un puissant outil de manipulation. Mais l'information, la communication, n'est pas l'apanage des journalistes, je trouve toujours dangereux ce discours qui pose le journalisme comme gardien du temple de certaines vérités (et l'article de Libération et celui de Next plongent dans ce travers) qui est lié avec le point suivant."
En conclusion, Clément reconnaît que la génération de contenu IA peut poser problème, mais que la presse a bien d'autres problèmes - plus importants - que lutter contre ces éditeurs :
"Je ne vais pas nier qu'il y a une vraie problématique au niveau de la génération de contenu d'actualité avec de l'IA. Cela pose des problèmes au niveau des droits d'auteur, c'est un fait et c'est même indéniable. Et oui, une certaine presse peut disparaître si et seulement si elle n'évolue pas et ce ne sera en aucun cas la faute de l'IA ou de quelques sites majoritairement insignifiants qui changeront quelque chose. J’en veux pour exemple un autre article “Quarante médias saisissent la justice pour bloquer «News DayFr», un des multiples «sites parasites» générés par IA” sur le fond on peut comprendre la démarche au vu du volume de contenu généré, sur la forme on parle ici d’un site qui fait 100K de trafic mensuel pour des revenus que l’on peut estimer, sans trop se tromper, à 300€ par mois. Il faut avoir des ennemis à la hauteur du conflit et ici ce n’est clairement pas le cas." - Clément Pessaux
Que penser de l'affaire ?
Nous choisissons de donner un droit de réponse aux référenceurs car il est important d'ouvrir ces débats : la place de l'IA dans l'édition, le risque de désinformation et la pérennité des médias (on vous conseille de lire également les commentaires sur l'article LinkedIn de Clément).
Chez Abondance, nous utilisons ChatGPT, Perplexity et Claude. L'IA est un outil, ce qu'on en fait relève de notre responsabilité. Si vous continuez à nous lire, c'est parce que nos articles sont utiles et pertinents. La valeur ne réside pas dans l'information mais dans la plus-value de l'éditeur.
Finalement, ce qui anime ce débat entre journalistes et éditeurs anime tous les référenceurs : comment me distinguer de mes concurrents ? comment apporter plus de valeur que les autres ? quel angle nouveau apporter à mes contenus ? comment inspirer confiance ? Abonnez-vous aux médias que vous estimez être de valeur. Chillez sur Discover. Développez votre esprit critique quand vous consommez un contenu. Bref, faites ce que vous voulez finalement. Nous, on continuera d'écrire des articles qui vous aident à apprendre le SEO.
Merci pour ton article Laura.
Mais avant de choisir un camp, il ne faut pas se tromper de débat.
Ce n’est pas un combat des « médias traditionnels » contre les contenus générés par IA qui est en cause ici, principalement. C’est un combat entre des producteurs de contenus qui croient en leur mission de journaliste et des acteurs qui s’affranchissent de toutes les règles éthiques et légales et utilisent l’IA à mauvais escient pour gagner deux fifrelins. Sans se soucier des conséquences.
Or aujourd’hui, les medias « full AI » utilisent des technos qui au mieux génèrent du « slot » (des contenus pourris) et au pire des contenus contenant des erreurs factuelles graves.
Au moins, quand nos amis blackhat généraient du « yaourt » à la place de textes normaux, personne ne se servait de leur pages de spam comme source d’information.
Là on génère des pages de sites d’actualités, dont les contenus remplis d’hallucinations ne sont contrôlés par personne. Avec un risque que ces contenus soient pris au sérieux.
Est-ce que l’on peut laisser faire cela sans réagir ? Non, ce n’est pas défendable.
Il y’a un changement d’échelle entre le « spam » à l’ancienne, et ce qui est permis par les IA génératives. Ce qui était gentiment irresponsable avant devient gravement irresponsable.
Tout éditeur de site a des droits, mais aussi des devoirs et doit respecter la réglementation et les règles du jeu économique, au risque sinon de se retrouver devant les tribunaux
Et tiens, c’est ce qui commence à arriver. Je trouve cela logique.
Je te rejoins. Et je ne pense pas que les éditeurs, dont Clément qu’on cite dans cet article, soient en désaccord avec la désinformation, la génération full-IA sans relecture, les hallucinations… Je te rejoins également sur le fait que, désormais, le risque est plus grand car les spammeurs disposent d’armes (e.g. Discover) à plus grande portée.
Mais la mesure reste de mise. Notre droit de réponse est aussi un moyen de rappeler qu’il ne faut pas « mettre tout le monde dans le même panier ». Des éditeurs full Disco, j’en connais plein, toi aussi, et ce ne sont pas tous des gens à l’éthique douteuse ou discutable.
PS : en réalité, au-delà du titre putaclic, je ne vois pas comment choisir un camp dans ce débat.
Vraiment très intéressant.
On dirait presque un match de boxe : d’un côté, la presse traditionnelle avec son expérience, de l’autre, l’IA qui enchaîne les uppercuts d’innovation. 😆
Plutôt qu’un combat, ce ne serait pas plus malin de voir une cohabitation intelligente ? Hâte de voir comment ça évolue. Merci pour cet article.