Que se passe-t-il au niveau de Google lorsqu'il détecte du contenu identique (ou similaire) sur plusieurs sites ? Comment identifie-t-il l'original et la copie ? Pénalise-t-il le site qui a copié le contenu (avec ou sans autorisation) comme on l'entend souvent ? La réponse dans cette vidéo...
On entend souvent dire qu'il ne faut pas copier/coller un contenu depuis un autre site web, sous peine de se voir pénalisé par Google. Mais qu'en est-il exactement ? N'est-ce pas une légende urbaine, un mythe SEO ? Cette vidéo explique la façon dont Google détermine l'original d'un contenu et donne une réponse claire et précise sur une éventuelle pénalité (au sens de "punition") de la part de Google envers un site copiant du contenu. Nous partons bien sûr ici du principe que la copie de contenu a été faite sans volonté de nuire (cas de spam ou de negative SEO), ce qui pourrait dans ce cas amener à d'autres conclusions. Mais ces pratiques restent marginales aujourd'hui... Bonne vidéo !
PS : Mila, au second plan dans la vidéo, semble très bien aller, merci pour elle 🙂
Google pénalise-t-il le contenu dupliqué intersites ?, vidéo proposée par Olivier Andrieu (Abondance). Source de l'image : Abondance |
Voici également quelques articles complémentaires (listés par ordre chronologique) pour approfondir le sujet :
- Duplicate content : 60% du Web est copié/dupliqué, selon Google (19 novembre 2015).
- Le Duplicate Content ne serait pas un critère Panda, selon Google (16 octobre 2015).
- Référencement de sites multilingues et risque de duplicate content - (Questions/réponses avec Google #16) (26 octobre 2011).
- Matt Cutts : duplicate content sur contenu traduit et indice de densité (21 décembre 2011).
- Duplicate Content : les Google Webmaster Tools vous avertissent (2 novembre 2011).
- Duplicate Content Dust et balise canonical - (Questions/réponses avec Google #14) (21 juin 2011).
- Etc.
N'hésitez pas également à visiter la zone "Vidéos SEO" du site et à vous abonner à la chaîne YouTube du site Abondance (ou à son fil RSS) pour découvrir, semaine après semaine, les prochaines vidéos que nous vous proposerons.
Personnellement, j’estime que dans le choix du contenu canonique par Google, le page rank/trust rank et autres critères de google jouent un rôle beaucoup, beaucoup plus grand que l’antériorité.
Et c’est un reproche qu’on peut/doit faire à Google. Et ce d’autant qu’à côté de critères objectifs (page rank), il y en a d’autres qui le sont moins. Ainsi, il y a quelques années (ce n’est plus le cas actuellement), Google positionnait souvent favorablement les contenus dupliqués dans des forums.
———
Il est possible aussi que les critères de classement de google en matière de contenus dupliqués varient selon le type de contenu (news, web classique, images, texte wikipedia,…).
——–
Il y a aussi des cas où Google se fourvoie complètement (c’est mon avis personnel). Faisant par ex. une recherche sur des animaux sauvages il y a quelques mois, j’ai trouvé très bien classé un site dont le contenu était pour chaque animal constitué de quelques « citations » recopiées de chacun des sites de référence en la matière.
Repensant au tintamarre que Google avait fait vers 2010 pour sa lutte contre les sites à contenus dupliqués, je m’étais dit qu’il lui restait beaucoup à faire. Après tout, s’il donnait plus de poids au critère « antériorité », on n’en arriverait pas là.
Bonjour,
Mais si un contenu éditorial est dupliqué sans que Google puisse établir qui est l’auteur, qui a la primauté, n’existe-t-il pas un risque que les deux pages soient alors jugées comme étant de faible qualité et se retrouvent par voie de conséquence dans l’index secondaire de Google ? Auquel cas le préjudice est incontestable…
Non il y a toujours 1 canonique et X dupliqués (X >= 1)
Une question qui n’est pas directement totalement liée à cette vidéo que vous pourriez un jour réaliser dans une vidéo est la suivante. J’édite un site qui a a beaucoup d’annonces (style petites annonces), du contenu d’agences de presse (style AFP) et peut-être 1% de contenu unique. Je m’attends à ce que ce contenu unique apparaisse au mieux dans Google, mais je me demande si le fait que 99% du contenu soit peu important en terme SEO (petites annonces pas géniales car changent beaucoup) car non-uniques (ou si unique peu pertinent comme petites annonces) et contenu de l’AFP portent un préjudice à ce 1% unique, avez-vous des informations à ce sujet? Par exemple, si je crée un article unique: « 10 moyens pour trouver du travail » sur ce site avec 99% de contenu non SEO-friendly ou je le crée sur un blog avec 100% de contenu unique (pas de petites annonces, pas de dépêches de AFP ou AP), est-ce que mon article (« 10 moyens pour trouver du travail ») sera mieux ranké sur le site avec 100% de contenu unique que celui avec 1%? C’est une question que je me pose depuis longtemps, sans vraiment avoir de réponses. Avez-vous des infos à ce sujet?
Dans ce cas, le « trust » que Google a envers le site va beaucoup jouer, AMHA. Et si le site a 99% de contenu copié d’autres sites, le trust risque de ne pas être fort… 🙂
Merci. Donc des sites comme Le Figaro ou Le Monde doivent faire attention de ne pas avoir 99% de contenu d’agences de presse style AFP ou AP, car sinon leur contenu unique risque de mal ressortir. Je pense ils le savent et écrivent souvent par ex. « Le Figaro avec agences », un moyen de faire un peu de contenu unique et éviter un copycat 100% de l’AFP par ex. Bien sûr ils ont aussi du contenu unique crée par leurs journalistes.
Oui on voit aussi parfois des articles d’une autre origine (souvent AFP) avec un titre et un chapô réécrits. A mon avis, ç ane suffit pas pour éviter le DC. Google n’est pas si bête 🙂
Bonjour
Qu’en est-il de la traduction de contenu ? Google le considère-t’il comme du duplicate content (à supposer qu’il sache le détecter) ou comme du contenu original ?
(Je parle d’une traduction faite soigneusement à la main, et avec l’accord de l’auteur 😉
Pas de duplicate content pour du contenu traduit. A voir : https://www.abondance.com/actualites/20111221-11207-matt-cutts-duplicate-content-sur-contenu-traduit-et-indice-de-densite.html
Oui, je suis bien d’accord avec toi, c’était juste pour citer une façon simple de doubler sur un point précis le Gogol.
Comme tu dis, ce n’est ni positif, ni négatif et c’est la que se situe le problème:
Pourquoi copier du contenu si ce n’est pour améliorer sa visibilité et surtout son positionnement?
Certains l’ont bien compris, pour récupérer l’antériorité et la paternité de l’article copié au détriment de l’auteur qui lui, bien que n’essuyant pas de pénalité au sens propre du terme perdra en visibilité.
Cela peut vite devenir dramatique si toutes ces pages sont concernées.
Si Mila a bien, tout va bien! 🙂 (effectivement, ça fait drôle sur la vidéo)
pour en revenir au duplicate, et hors négative SEO, on peut constater qu’i est tout de même pénalisant bien que n’entraînant aucune pénalité (punition de google).
Il est relativement aisé par exemple de faire passer un article comme étant le premier publié surtout si le duplicate est réalisé a partir d’un texte publié sur la journée pour ne donner que ce cas de figure!
Merci pour Mila 🙂
Ce n’est pas si simple sinon. L’antériorité n’est pas le seul critère. Le PageRank joue aussi, tout comme certainement le Trust du site auprès de Google.
Et copier un contenu n’est en soit pas pénalisant, c’est juste qu’on n’obtient pas de visibilité avec. dans ce cas, ce n’est ni positif, ni négatif. c’est juste neutre… 🙂