Google l'a répété une fois de plus : le contenu généré automatiquement par des algorithmes de type GPT-3 est considéré comme du spam et est donc pénalisable par le moteur de recherche. Tout est ensuite certainement affaire de nuances...
John Mueller (Google) l'a indiqué (à nouveau, car ce n'est pas une nouveauté) lors d'un récent hangout avec des webmasters : le contenu généré automatiquement grâce à l'intelligence artificielle et des outils comme GPT-3 et assimilés, est considéré comme du spam et va à l'encontre de ses recommandations pour les webmasters. Il est donc potentiellement passible de pénalités de la part du moteur de recherche.
Une page dédié à ce contenu généré automatiquement est d'ailleurs disponible dans ces recommandations. Voici ce qu'elle dit :
Le contenu généré automatiquement repose sur la programmation. Lorsque ce contenu est destiné à manipuler les classements de recherche plutôt qu'à aider les utilisateurs, Google peut intervenir. Voici quelques exemples (liste non exhaustive) :
- Texte qui contient peut-être certains mots clés de recherche mais qui n'a aucun sens pour le lecteur ;
- Texte traduit par un outil automatisé sans intervention humaine, ni correction avant publication ;
- Texte généré par des processus automatisés, tels que les chaînes de Markov ;
- Texte généré à l'aide de techniques automatisées de synonymie ou d'obscurcissement ;
- Texte généré en détournant des résultats de recherche ou des flux Atom/RSS ;
- Assemblage ou combinaison de contenus issus de différentes pages Web sans ajout de valeur.
Si vous hébergez un tel contenu sur votre site, empêchez son affichage dans la recherche Google.
Quand on sait que Google sait aujourd'hui faire la différence entre un texte rédigé par des humains et un texte conçu par un algorithme, on peut comprendre que le texte créé par intelligence artificielle comporte des risques non négligeables.
On peut cependant aussi comparer cette situation à celle du spinning : si c'est fait avec des méthodes de bourin (massivement et sans intervention humaine), il est évident que c'est condamnable parce que détectable (qui plus est, c'est éthiquement et humainement blâmable). Mais si les algorithmes ne sont que des outils secondaires et qu'une partie humaine est ajoutée à un « premier jet » réalisé par une machine, il y a de fortes chances que cela soit totalement indéctectable et non pénalisé.
Il reste donc à savoir à quel niveau on se positionne sur l'échelle du bourinage… 🙂
La question posée à John Mueller lors du hangout pour webmasters. Source : YouTube
Bonjour Olivier
J’ai un big doute que Google sache détecter un contenu généré automatiquement par l’IA.
Mais comme le dit John Mueller, le principal est que le texte fourni réponde à l’intention de recherche de l’internaute.
S’il ne répond pas exactement, de toute façon, IA ou non IA, il ne sera jamais sur la 1ere page.
Ensuite, évidemment il ne faut pas faire un copier coller « bêtement » du rendu du générateur qui là clairement selon Google est du spam.
Ce générateur de contenu doit plutôt le prendre comme un outil d’aide à la rédaction, on y ajoute du texte personnalisé, on rajoute quelques liens et images.., bref on le personnalise.
Actuellement, je suis entrain de tester un de ses générateurs et j’avoue que c’est quand même bluffant.
Il trouve la trame de la page avec les les balises H2 , on peut à l’infini (selon option tarifaire bien sur), rajouter des paragraphes, mixer entre eux, et le résultat est quand même très bon.
On peut gagner sur une création d’un article je pense 2 bonnes heures.
Et surtout le rendu est largement meilleur, dans 90%, que le contenu créé par des personnes habitant hors UE , et cela pour un coût moindre.
Enfin, et surtout, cela ne remplacera jamais un contenu généré par un rédacteur web professionnel, mais à quel prix (que seul les grosses entreprises pourront se l’offrir).
Cela me rappelle une interview sur ce sujet qui date, entre Lucie Rondelet et vous même.
PS: je dirais pour conclure, que la génération de contenu par IA est identique à l’achat de backlinks, c’est strictement interdit par Google, mais tout le monde l’utilise avec des sociétés spécialisées sur cette thématique. Après il faut savoir les utiliser intelligemment, et cela est un autre problème…
Quand on voit qu’il y a certains de ces contenus qui apparaissent régulièrement dans Google Actus et les alertes Google il y a de quoi être dubitatif.
Je fais du contenu généré automatiquement depuis 15 ans… et comme celui-ci répond parfaitement à des besoins, il n’y a jamais eu de problèmes…
Quel cirque, cette communication de Google. La réalité est tout le contraire : les résultats de Google sont tellement ouverts aux contenus générés automatiquement qu’ils se multiplient de plus en plus. Le moteur de recherche est d’ailleurs leur seule raison d’être. C’est un fait que Google, lui-même, confirme lorsqu’il publie ses statistiques, toujours en hausse, de spams supprimés (bien trop tard) de son index.
Voyez par ex. votre propre article du 7 avril dernier sur les images dans la recherche universelle, c’est linguee (contenu généré automatiquement) qui apparaît en PERMIERE place sur la première capture d’écran.
lire: PREMIERE
et bimmm comme sur Bing qui annonce aussi la couleur sur sa page « Ligne directrices » de Help Webmaster :
« Contenu généré automatiquement : Le contenu généré par la machine est une information générée par un processus informatique automatisé, une application ou un autre mécanisme sans l’intervention active d’un humain. Le contenu comme celui-ci est considéré comme malveillant, et contient normalement du texte d’ordures qui n’a été créé que pour garnir un classement supérieur. Ce type de contenu entraînera des pénalités. «
Désolé mais j’ai été pris pour une machine pour un commentaire élogieux sur une promenade en catamaran donc pour moi la machine n’est pas encore au point
Mon cerveau n’a pas de nano technologie et quand je dis m » » »e c’est bien français
Comme aurait dit Cambronne !!!