un pirate est peut être en train d'insérer à votre insu dans vos pages des balises "canonical", montrant à Google que vos documents sont dupliqués des pages du site du pirate... Bad trip...
Le site Search Engine Watch relate, sur la base d'une discussion dans le forum Webmaster World, le fait qu'un nouvelle forme de spamdexing (fraude aux moteurs de recherche) verrait le jour actuellement : l'insertion de balises "link rel canonical" dans des pages d'un site à l'insu de leur webmaster.
Le principe est finalement assez simple : un pirate s'introduit sur votre site et intègre dans vos pages une balise "link rel canonical" indiquant à Google que la page en question est dupliquée d'une page sur le site du pirate. C'est donc cette page qui sera mise en avant par le moteur de recherche dans ses résultats. La page "canonique" du pirate recevra également les backlinks de la page piratée.
Plus fort encore : certains pirates mettraient en place un système de cloaking, ne montrant la balise "canonical" qu'aux moteurs et pas aux internautes. Ainsi, ni vu ni connu et difficile de vérifier si tout va bien (on pourra, dans ce cas, utiliser l'outil, dans les Webmaster Tools, qui vous indique comment Googlebot voit votre code HTML)...
Attention donc de vérifier que votre site ne connaît pas d'intrusion de ce type, sachant qu'un pirate pourrait faire bien pire encore une fois qu'il est dans la place...
Source de l'image : Search Engine watch |
Articles connexes sur ce site :
- Deux nouvelles balises meta pour identifier la source d'un contenu (18 novembre 2010)
- Google : la balise "rel=canonical" maintenant disponible pour des sites différents (16 décembre 2009)
- Duplicate Content : Google, Microsoft et Yahoo! s'entendent sur une balise commune (16 février 2009)
- Contenus syndiqués et Duplicate Content (22 janvir 2008)
Bonjour, En effet je ne savais pas que l'on pouvait l'utiliser inter sites…
Merci pour l'info.
Bonne journée
La vidéo date du 12 février 2009…
Le 16 décembre 2009, la balise a été étendue aux sites diférents :
http://actu.abondance.com/2009/12/google-la-balise-relcanonical.html
La veille c'est important, il faut lire Abondance quotidiennement 🙂
ps : bon pour l'explication, je laisse tomber, pas grave 😉
Bonne soirée
a+
"En gros, on parle de lien ou de balise canonical ?" j'ai peur que l'on passe beaucoup de temps à expliquer les choses… il s'agit d'un "Canonical link element" c'est dans le film 😉
Un peu plus loin, toujours dans cette même vidéo, il est expliqué que : "we allow things within the same domain but we don't allow things to cross domain (…) right now with this element you can only use it within the same domain"…
Nous autorisons des choses (échanges) dans un même site mais pas entre sites (…) actuellement vous ne pouvez utiliser cet élément que dans un même site. Matt Cutts ajoute plus loin qu'il par contre possible de l'utiliser dans les sous-dommaines d'un même site.
Bon référencement.
et si on a pas de balise canonical ?
c'est grave ??
"les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte"
Je n'en ai pas eu l'usage donc je n'ai pas mémorisé la source
mais il me semble bien que justement un Rel Canonical peut faire référence à un autre site (c'est obligé parfois pour signaler une duplication hors site)
et que donc il a PRESQUE tous les "avantages" d'une 301. J'ai bien dit PRESQUE.
Ce piratage serait donc une application de cette "redirection".
David
@referencement : ben j'aurais préféré une explication plutot que l'URL d'une vidéo très connue sur le sujet 🙂
En gros, on parle de lien ou de balise canonical ? Je ne vois pas le rapport entre les deux ? En fait, pour moi, la phrase " les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte par Google" ne veut rien dire, ou alors je ne la comprends pas, ce qui est possible… D'où la nécessité d'une explication…
Pour l'autre partie attention : la balise canonical ne peut pas etre remplacée a chaque fois par une 301, heureusement d'ailleurs; Elle sert surtout en cas de partenariat et syndication, pour mettre dans la version imprimable d'une page, etc. voire dans le cas de duplicate content de type DUST, etc. Et là, pas de 301 possible…
cdt
@Abondance : les réponses que tu cherches pour la première phrase sont dans cette vidéo : http://www.youtube.com/watch?v=Cm9onOGTgeM
Pour la troisième phrase, je n'ai peut-être pas été clair. Utiliser une redirection 301 est simple et clair puisque l'internaute n'a plus accès à la page redirigé et ne pénalise donc presque pas le référencement. A l'inverse, lorsque que l'on utilise un élément canonical, l'internaute a accès à la page "dupliquée". C'est donc moins propre qu'une redirection 301. Sachant que l'important est, si possible de gérer, ces problèmes de duplication de contenu le plus en amont possible et d'utiliser l'élément canonical uniquement si aucune autre solution n'est envisageable.
@Référencement : euh, je n'ai pas compris la première et la troisième phrase ????
"Comme annoncé à leur lancement, les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte par Google."
Ce ne sont pas les liens qui utilisent les balises canonical ??
"Pour info l'utilisation de canonical n'est pas très bien gérée jusqu'à preuve du contraire car même si le moteur de recherche est informé d'un duplicate content, l'internaute lui ne le sait a priori pas…"
Alors là j'avoue que je ne comprends pas la phrase ;))
a+++
Comme annoncé à leur lancement, les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte par Google.
Le référencement n'est donc normalement pas impacté par une telle pratique. Maintenant, il bien évident que si le pirate est dans la place les conséquences peuvent être dramatiques.
Pour info l'utilisation de canonical n'est pas très bien gérée jusqu'à preuve du contraire car même si le moteur de recherche est informé d'un duplicate content, l'internaute lui ne le sait a priori pas…
comment est-ce possible ? si vos articles sont en base de données, je ne vois vraiment pas comment un pirate peut faire pour insérer du contenu… à moins d'avoir les pass de la bd…
On risque de voir quelques procès débarquer. Sur certains secteurs, ça va s'amuser.
D'où l'intérêt de maîtriser les solutions techniques (CMS, blogs, forums, wiki…) employées 😉
très très malin et inquiétant…
se voir quasiment disparaitre de l'index google, c'est disparaitre… les dommages sont bien plus importants qu'un effacement de site où un backup résoudra le problème assez vite finalement.
Par contre là le mal est vraiment important sur du long terme 🙁
J'en tire mon chapeau, c'est d'une finesse. Il faut avouer que c'est tout de même plus beau qu'un spam comment en masse.
L'imagination de certains n'en finira jamais de m'étonner.