Le DUST (Duplicate URL, Same Text) consiste à traiter les cas (venant de multiples causes possibles) où une même page web, donc un même code source, est accessible au travers d'intitulés d'URL différents dans un maillage interne ou venant de backlinks externes. Explications et traitement du problème...
Tous les sites web, sans exception, souffrent d'une forme de Duplicate Content appelé DUST (Duplicate URL, Same Text). En effet, si on a la main sur son maillage interne, on ne maîtrise jamais la façon dont d'autres sites font des liens vers le vôtre. Et, parfois, les liens pointant vers une même page web (un même code source) peuvent avoir plusieurs intitulés différents. Créant ainsi un phénomène de contenu dupliqué qui peut s'avérer nocif. Voici comment lutter contre ce fléau ! Bonne vidéo !
Le DUST (Duplicate URL, Same Text), c'est quoi ?, vidéo proposée par Olivier Andrieu (Abondance). Source de l'image : Abondance |
Voici également quelques articles complémentaires (listés par ordre chronologique) pour approfondir le sujet :
- Le contenu dupliqué : un cauchemar pour les moteurs ou pour les webmasters ? (15 décembre 2010).
- Google accepte les indications "canonical" dans les en-têtes HTTP (20 juin 2011).
- Duplicate Content Dust et balise canonical - (Questions/réponses avec Google #14) (21 juin 2011).
- Quiz : Que signifie l'acronyme DUST ? (15 avril 2015).
- Le SEO, c'est dans l'en-tête (HTTP) ! (13 juillet 2015).
- Google : quelques infos confirmées sur le fonctionnement du moteur (28 janvier 2016).
N'hésitez pas également à visiter la zone "Vidéos SEO" du site et à vous abonner à la chaîne YouTube du site Abondance (ou à son fil RSS) pour découvrir, semaine après semaine, les prochaines vidéos que nous vous proposerons.
Merci pour cette réponse claire et concise !
Salut Séverine,
N’ayant pas eu de réponses pour l’instant, j’ai étudié en profondeur la même question que toi.
Ma réponse est claire, un site qui est solidement développer na pas besoin de balise canonical !
– Du coté expérience utilisateur il évident qu’il faut une seul et unique url accessible.
– Du coté référencement et duplicate, quoi de mieux de ne pas dupliquer le contenu !
Il reste la question de savoir si les mauvaises url doivent renvoyez à la requête client un entête HTTP de type 404 ou redirection permanente 301
Au vue de la très bonne compréhension des moteurs, (comme le dit si bien l’article http://www.webrankinfo.com/dossiers/strategies-de-liens/tutoriel-redirections#gref )
les deux solutions sont possible.
Perso pour mon site les « www ou sans www », les « racine.com ou racine.com/index.php ou racine.com/index.html » , les « /articles/ ou articles », page.html ou page.html?blabla » sont redirigés en 301 coté php pour l’experience. Le reste est du domaine du 404.
En conclusion, les gens qui maitrisent à 100% leurs url et qui sont prêts à investir du temps en dev (comme moi) ne doivent pas utiliser de canonical. Outre le fait d’avoir une api parfaite niveau url, la mesure pourrait permettre de favoriser l’expérience utilisateur et le trustrank de façon extrêmement infime.
Par contre si il y à le moindre doute d’une duplication possible : canonical oblige !
Bonjour et merci pour ce bon tutoriel,
A la question du DUST, j’envisageais de répondre avec des redirections 301.
Quel est donc l’intérêt de la balise rel canonical par rapport à la redirection 301 ? Est-ce particulièrement recommandé pour les sites externes qui pointent vers le nôtre ?
Cordialement,
Bonjour Séverine
Non, malheuresuement, vous ne pouvez pas répondre au DUST de façon exhaustive avec des 301. Tout simplement parce que vous ne maitrisez pas, par définition, les différentes formes d’URL qu’un autre site va mettre en place pour pointer vers vos pages. Les 301 vont permettre de gérer certaines formes, comme la gestion des paramètres d’URL de la Search Console, mais ça ne sera obligatoirement pas exhaustif. Un autre site peut rajouter des tas de paramètres à une URL d’un lien qui pointe vers une de vos pages et vous n’allez pas faire une veille pour détecter toutes ces URL… Dans ce type de cas, seule la balise « canonical » convient…
Bonjour,
Merci pour la vidéo très sympa !
Mais pareillement, je me pose la question sur l’incidence de la simple présence de la balise.
Pour répondre à Olivier je dirai que la crainte : c’est l’incidence sur le TrustRank que peux avoir la présence
d’une t’elle balise.
En effet, dans une optique de faire : « du référencement sans en faire », la présence même de la
meta canonical, (comme d’ailleurs de la meta robots) donne une information à Google sur le genre de
gérance du site.
Il est indéniable que l’utilisation de la balise Canonical est obligatoire avec les plateformes cms
Open sources d’aujourd’hui : qui d’origine sont des machines à dupliquer les pages, mais pour
les petits sites en fichiers physiques ou les API sur mesure bien conçues, y à t’il
une véritable utilité ?
Sachant qu’il est toujours possible qu’un concurrent fasse un lien avec des paramètres dans l’url.
Dans ce cas : le fichier d’un site statique et la plus part des routers des API vont afficher la page avec
ou sans paramètres.
Mais Google doit bien comprendre que après le « ? » ce n’est plus une page web dans la plus part des cas.
D’ailleurs il y a quelques années il me semble que la question de la Canonical n’était pas à l’ordre du jour :
Perso j’avais quand même de bon résultat SEO sans Canonical.
Je suis peut être parano, je sais, mais je préfère prendre en compte toutes les possibilités.
Merci
Merci pour cette vidéo Olivier. Super claire 😉
Pour résumer, on peut dire que
— le canonical a un effet similaire à une redirection 301, sauf qu’il n’a d’effet que pour les moteur de recherche et pas pour les visiteurs humains
— et avec la nuance que la canonical est une indication (pas une instruction contraignante) donnée aux moteur qui peuvent éventuellement ne pas le suivre.
— la balise canonical peut être utilisée pas seulement à l’intérieur d’un même site mais aussi pour des contenus dupliqués sur des sites différents.
Si on utlise les balise canonical et les sitemaps ca devrait pas poser trop de problèmes.
La question c est qui utilise vraiment cela ?
Qui informe les moteurs de recherche comme il faut c-a-d comme indiqué ici:
http://www.sitemaps.org/fr/protocol.html#informing ?
Pratiquement personne.
Si je dis pas de bêtise, la balise canonical signifie que le contenu présent sur cette page est dupliqué d une autre (dans mon cas la racine du site et index.php) et qu il doit prioriser la page d origine.
Je pensais donc qu il donnerai moins d importance à la page.
Bonjour Olivier et merci pour cette vidéo très intéressante (comme d habitude)
Je me pose cependant une question :
Le fait de mettre une balise canonical pour notre page d index (par exemple)
Cela ne va t il pas réduire sa « pertinence » aux yeux de Google?
Ma réponse sous forme d’une question : pourquoi est-ce que ça réduirait la pertinence de cette page aux yeux de Google ? 🙂
Vous avez des supers idées, bonne continuation pour votre travail.
Bonjour,
merci pour ces explications, cependant lorsque mon URL est composée de paramètres de campagnes Google, je n’ai pas de page à proprement parler sur mon site, comment indiquer la page canonique dans ce cas ?
merci d’avance
Dans le code source de la page correspondant à l’URL en question.
Vidéo très claire sur l’utilisation de cette balise canonical. Merci, c’est très utile.
Merci pour cette explication ! Elle est très claire. 🙂