En cas de duplicate content, il était jusqu'à maintenant possible d'indiquer à Google quelle était la page canonique à préférer dans ses résultats du moteur, au moyen d'une balise à insérer dans le code HTML. Cette indication peut maintenant être fournie directement dans l'en-tête HTTP du serveur...

Google vient d'annoncer que son moteur de recherche acceptait dorénavant les indications "canonical" directement dans les en-tête HTTP en complément de cette même indication dans les balises "link", selon la section 5 de la directive IETF RFC 5988.

L'exemple fourni par Google est celui-ci : imaginons qu'un site propose deux versions (HTML et PDF) d'un même document, aux adresses :
http://www.example.com/white-paper.html
http://www.example.com/white-paper.pdf

Le webmaster pourra alors indiquer au moteur que la version HTML est canonique (l'original) alors que la version PDF est dupliquée (la copie) au travers des directives suivantes, après configuration du serveur :

GET /white-paper.pdf HTTP/1.1
Host: www.example.com
(...rest of HTTP request headers...)

HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://www.example.com/white-paper.html>; rel="canonical"
Content-Length: 785710
(... rest of HTTP response headers...)

Ce système peut également être utilisé lorsque se produit des phénomènes de duplicate content de type DUST (Duplicate URL, Same Text), où une même page peut être accédée au travers de plusieurs URL différentes.

Si ce système vous intéresse, n'hésitez pas à contacter votre administrateur système pour voir comment l'intégrer sur votre serveur...

Jumeaux
Source de l'image : DR

Articles connexes sur ce site :
- Du spamdexing à base de balise "canonical" (22 mai 2011)
- Deux nouvelles balises meta pour identifier la source d'un contenu (18 novembre 2010)
- Google : la balise "rel=canonical" maintenant disponible pour des sites différents (16 décembre 2009)
- Duplicate Content : Google, Microsoft et Yahoo! s'entendent sur une balise commune (16 février 2009)
- Contenus syndiqués et Duplicate Content (22 janvir 2008)