En cas de duplicate content, il était jusqu'à maintenant possible d'indiquer à Google quelle était la page canonique à préférer dans ses résultats du moteur, au moyen d'une balise à insérer dans le code HTML. Cette indication peut maintenant être fournie directement dans l'en-tête HTTP du serveur...
Google vient d'annoncer que son moteur de recherche acceptait dorénavant les indications "canonical" directement dans les en-tête HTTP en complément de cette même indication dans les balises "link", selon la section 5 de la directive IETF RFC 5988.
L'exemple fourni par Google est celui-ci : imaginons qu'un site propose deux versions (HTML et PDF) d'un même document, aux adresses :
http://www.example.com/white-paper.html
http://www.example.com/white-paper.pdf
Le webmaster pourra alors indiquer au moteur que la version HTML est canonique (l'original) alors que la version PDF est dupliquée (la copie) au travers des directives suivantes, après configuration du serveur :
GET /white-paper.pdf HTTP/1.1
Host: www.example.com
(...rest of HTTP request headers...)
HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://www.example.com/white-paper.html>; rel="canonical"
Content-Length: 785710
(... rest of HTTP response headers...)
Ce système peut également être utilisé lorsque se produit des phénomènes de duplicate content de type DUST (Duplicate URL, Same Text), où une même page peut être accédée au travers de plusieurs URL différentes.
Si ce système vous intéresse, n'hésitez pas à contacter votre administrateur système pour voir comment l'intégrer sur votre serveur...
Source de l'image : DR |
Articles connexes sur ce site :
- Du spamdexing à base de balise "canonical" (22 mai 2011)
- Deux nouvelles balises meta pour identifier la source d'un contenu (18 novembre 2010)
- Google : la balise "rel=canonical" maintenant disponible pour des sites différents (16 décembre 2009)
- Duplicate Content : Google, Microsoft et Yahoo! s'entendent sur une balise commune (16 février 2009)
- Contenus syndiqués et Duplicate Content (22 janvir 2008)
@ merci bcp de l'info
A+
Ah oui OK en fait, lorsque le nombre de pages augmente de façon très forte, le mieux est d'y aller par étapes pour ne pas "brusquer la bête" et d'ouvrir les vannes petit à petit…
En règle générale, ça marche plutôt bien…
a+
je suis pas certain que Google digère bien de passer de 3000 a 8 millions de pages du jour au lendemain, changer les titres et nom de pages des 3000 pages restantes, changer complètement la page d'accueil, d'éclater le gros bazar en sous domaines …
Je pensais partir sous un nouveau NDD (B), puis rediriger en 302 ou avec la balise canonical vers l'ancien (A) dès le début de référencement du B.
Je voudrais pas risquer dutout un blacklistage du A en le changeant à 100% …
Bonojur
Bizzarement, ma réponse a sauté ????
Je disais que oui ça fonctionne pour deux sites différents.
Mais que je m'étonnais de la méthode : pourquoi Google sanctionnerait-il un site dont la structure évolue ?? Je ne vois pas la raison ??
cdt
arf, j'espérai "piocher" un bon conseil gratos, c'est loupé … 😉
Cela fonctionne sur 2 nom de domaine différent?
cas d'école ; je veux changer totalement la structure du site A. Par crainte que google sanctionne, je décide de faire un nouveau site B. Je laisse A dans l'état au début, quand google a indexé totalement le site B, je le copie exactement sur le site A.
Je met ensuite la balise canonical pour dire que A est le site principal. J'attends de voir le résultat pour savoir si je met B en redirection 301 ou au contraire A en 301 vers le site B. Je risque des ennuis ou j'ai la certitude que le site A ne sera pas sanctionné?