Il existe de très nombreux outils disponibles sur le Web pour mieux gérer le Contenu Dupliqué (Duplicate Content) entre plusieurs sites différents. Voici ceux que j'utilise dans le cadre de mon activité de Consultant SEO (en attendant le contenu dupliqué intrasite la semaine prochaine).

Dans la lignée de ma vidéo de la semaine dernière, dans laquelle j'expliquais comment Google détecte et traite le contenu dupliqué, voici une petite vidéo dans laquelle j'explique quels sont les différents outils que j'utilise au quotidien pour gérer le contenu dupliqué interdites sur mes sites et ceux de mes clients...

Voici également la liste des outils dont je parle dans cette vidéo, avec leur lien respectif :

Et voici donc nos outils du contenu dupliqué intersites dans cette 172e vidéo Abondance :

Les Outils du Contenu Dupliqué Intersites. Vidéo N°172 proposée par Olivier Andrieu (Abondance). Source : Abondance

Transcript de la vidéo "Les Outils du Contenu Dupliqué Intersites" :

Bonjour et bienvenue dans cette 172e vidéo Abondance dans laquelle je voulais vous parler, dans la suite de la vidéo précédente, de contenu dupliqué et des outils que j'utilise dans le cadre de la détection du contenu dupliqué intersites, donc entre sites différents - la semaine prochaine je ferai une vidéo sur la détection du contenu dupliqué intrasite, à l'intérieur d'un même site, mais cette semaine on va parler de sites différents - par exemple ici deux sites, le Courrier picard et Boursorama qui reprennent typiquement un article de l'AFP à l'identique.

Comment détecter finalement ce contenu dupliqué, lorsque vous avez du contenu sur votre site ? Ça peut être tout à fait normal, vous pouvez avoir mis en place des partenariats, exactement comme on le voit de chaque côté ici. Pas de problème majeur. Vous pouvez avoir un fil rss aussi qu'un certain nombre de sites ont repris. Si vous avez un fil rss, ne reprenez pas, n'indiquez pas dans votre fil rss tout le contenu de l'article, parce qu'avec ça vous allez fabriquer une usine à contenu dupliqué. Ne mettez dans votre fil rss que le titre et le chapô pour éviter ce type de phénomène. Vous pourrez comme ça regarder qui reprend votre fils rss et fait des liens bien sûr vers vous, c'est toujours bon à prendre. Par contre, ça peut être aussi un pillage sans votre autorisation, du copier coller de la part de sites qui n'ont pas demandé votre autorisation pour le faire. Comment faire ? Nous avons plusieurs solutions.

La première solution, la plus simple, pour des besoins ponctuels, on va copier / coller une phrase de l'article sur Google et voir quel est le résultat. Dans ce cas-là, je recherche plutôt une phrase qui est dans la deuxième moitié, dans la moitié inférieure de l'article, pour éviter d'avoir du contenu qui se retrouve aussi dans le fil rss, ça pourrait fausser un petit peu l'analyse. Donc plutôt un contenu hors du fil rss, plutôt deuxième moitié. 32 mots maximum parce que Google ne va pas accepter les requêtes de plus de 32 mots. Je fais un copier / coller et entre guillemets. Surtout pensez bien à mettre les guillemets pour avoir l'expression complète. Je copie / colle cette phrase ou ces deux phrases dans Google entre guillemets et le moteur de recherche va me dire : "voilà j'ai trouvé ton article - tant mieux, heureusement 🙂 - et j'ai aussi trouvé un autre site qui reprend cet article". À moi de voir derrière qui il est, est-ce qu'il scrape sans autorisation, est-ce qui fait a minima un lien en follow etc.

C'est un travail qui se fait derrière donc c'est la façon la plus simple de faire. Par contre pour des cas isolés, ça va. Si on veut automatiser, si votre site a vraiment des problématiques de plagiat assez fortes, ça va être compliqué de faire ça à chaque fois. Donc on peut utiliser un outil comme Kill Duplicate, par exemple, l'outil de SEO Hackers, une société française, qui va automatiser, qui va scanner votre site. On peut lui fournir des URL, on peut lui fournir des textes comme on vient de le faire, etc.

Il y a plusieurs solutions pour gérer la détection du contenu dupliqué. Il va vous donner un tas d'informations sur qui reprend votre contenu par exemple ici les dates du dernier scan, le prochain scan, le code http qui est renvoyé par votre URL, le taux moyen de duplication qu'il a détecté, le taux le plus fort qu'il a détecté, donc là il y a des pages et des sites qui reprennent à 100% le contenu de mon article, il faudra quand même que j'aille voir, le nombre de fois où il a trouvé une page qui reprend mon contenu et la position maximale, je crois, de la page sur Google le positionnement maximal de la page sur Google. Donc tout un tas d'informations. J'en profite pendant que j'y pense, je veux dire que je ne touche aucune commission sur les ventes des outils que je montre ici 🙂 Donc pour cette URL ici, il va me proposer toutes les URL qui reprennent mon contenu avec le code http, est-ce que ce site fait un lien - c'est la moindre des choses - est-ce que c'est un lien en nofollow ou en dofollow. Si c'est un lien nofollow, on va peut-être aller le voir en disant gentiment que ça serait quand même plus sympa et un petit peu plus fair play de faire du follow, d'autant plus que tu n'y gagnes rien à faire du nofollow. Est-ce que c'est un iframe ? S'il n'y a pas de lien, évidemment on va aller demander, ça permet de récupérer du lien, etc. etc. Le taux de duplication détecté, enfin tout un tas d'informations vraiment sur qui reprend mon contenu et puis les actions à mettre en place et éventuellement les solutions possibles : contacter le site - il va essayer de récupérer l'adresse mail du responsable du site - ou contacter l'hébergeur à qui on dira qu'il y a des gens qui font des choses pas cleans chez lui, ou une plainte DMCA auprès de Google. Les courriers seront quasiment prémâchés, il n'y a plus qu'à faire des copier / coller. Donc un outil assez intéressant si on a des problématiques assez forte de plagiat, à un moment donné, il faut automatiser avec ce type d'outil.

Autre solution que j'utilise assez souvent, c'est l'outil de Copyscape/compare.php. C'est assez simple : on rentre 2 url ou deux textes en copier / coller et l'outil va nous donner le pourcentage de similarité entre les deux contenus. C'est gratuit ici, j'ai tapé de 2 url d'un de mes sites, il dit que la similarité est entre 3% et 12%, aucun souci, il n'y a pas de contenu dupliqué. En général, à partir de 70 / 80% on commence à s'affoler un petit peu du côté du contenu dupliqué. On a un petit outil sympa qui peut servir aussi de temps en temps. Quatrième solution : il y a des tas d'autres outils que vous pouvez tester : Copyscape, bien sûr, qui a une solution de type KillDuplicate, Duplicate Content Checker, Dupli Checker, CopyWritely, SiteChecker, enfin il y en a plein, on peut tester la plupart d'entre eux parfois c'est payant, parfois pas,  etc. Bref n'hésitez pas à tester ces outils et vous trouverez une solution qui correspond à vos besoins.

Voilà, je vous engage à voir mes vidéos sur le sujet du contenu dupliqué : 21, 30, 42 59, 144 et la 171 de la semaine dernière qui explique comment Google détecte le contenu dupliqué. Merci beaucoup, je vous remercie pour votre attention, je vous dis à très bientôt pour une nouvelle vidéo Abondance sur le contenu dupliqué intra site, cette fois ! Merci et au revoir ! 🙂

  

  Autres vidéos touchant à ce sujet

 

   Articles complémentaires (listés par ordre chronologique)

 

   Notre Chaîne YouTube

N'hésitez pas également à visiter la zone "Vidéos SEO" du site et à vous abonner à la chaîne YouTube du site Abondance (ou à son fil RSS) pour découvrir, semaine après semaine, les prochaines vidéos que nous vous proposerons.