Goossips : Pourcentage de Contenu Dupliqué

Olivier Andrieu / 10 Oct 2022 à 08h06

Temps de lecture : 2 minutes

Partagez l'article

Goossips : Pourcentage de Contenu Dupliqué

Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : À partir de quel pourcentage de similarité peut-on considérer que deux contenus sont dupliqués ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, forums, conférences, etc.). Donc « gossips » (rumeur) + Google = « Goossips » 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

Pourcentage de Contenu Dupliqué

John Mueller a indiqué sur Twitter qu'il n'existait pas pour Google un chiffre de pourcentage de similarité entre deux contenus permettant d'indiquer si oui ou non il existe un phénomène de contenu dupliqué entre ces deux textes (par exemple : si les 2 textes présentent un taux de similarité de plus de X %, alors il y a contenu dupliqué).

Source : Search Engine Roundtable

Taux de fiabilité :

On est d'accord. Les chiffres qui circulent ne sont qu'une approximation et une façon de traiter le problème. Pourtant, dans la majeure partie des cas, cela fonctionne assez bien. Pour notre part, nous travaillons sur une base de 70% de similarité en analysant un site entier grâce à Screaming Frog ou 2 pages isolées grâce à Copyscape. D'autres SEO peuvent bien sûr fonctionner différemment...

Goossips : Pourcentage de Contenu Dupliqué. Source : Google

7 Commentaires

Jérémy Mauboussin sur 10 octobre 2022 à 22 h 19 min

Bonjour Olivier. Pour une vérification à grande échelle (1000 à 100 000 pages)… il y a toujours PlagiaShield. 🙂
Réponse
- Olivier Andrieu sur 11 octobre 2022 à 7 h 26 min
  
  Oui dans l’article, je parlais avant tout d’intrasite. Pour l’intersite, il y a effectivement beaucoup de solutions (dont l’excellent KillDuplicate) 🙂
  Réponse
DaviD sur 10 octobre 2022 à 9 h 49 min

Hello Olivier,

Sommes-nous bien d’accord que le contenu considéré comme dupliqué donc potentiellement « sanctionné » ne sera pas celui d’origine ?
Réponse
- Olivier Andrieu sur 10 octobre 2022 à 9 h 51 min
  
  Il n’y a pas de notion de « sanction » en termes de contenu dupliqué.
  Réponse
- amira sur 10 octobre 2022 à 11 h 58 min
  
  même question
  Réponse
Anonyme sur 10 octobre 2022 à 9 h 26 min

Bonjour Olivier, merci pour l’info « nous travaillons sur une base de 70% de similarité en analysant un site entier grâce à Screaming Frog » : est-ce que cela signifie que vous cochez « Activer les quasi doublons avec un seuil de 70% » ?
Merci
D
Réponse
- Olivier Andrieu sur 10 octobre 2022 à 9 h 28 min
  
  Je configure ici : Configuration > Contenu > Doublons
  Réponse

Laisser un commentaire Annuler la réponse

Goossips : Pourcentage de Contenu Dupliqué

Articles complémentaires :

Goossips SEO : contenu dupliqué, URLs et Google Trends

Goossips SEO : Grands sites et syndication de contenu

Goossips SEO : MAJ Bing Search/Chat, contenu de haute qualité, extraits FAQ

Goossips SEO : balises événements, contenu bloqué, problème d’indexation

Goossips SEO : contenu, URL canonique, backlinks, noindex et localisation