Goossips : URL Canonique et Sitemap XML

Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : En cas de contenu dupliqué interne sur un site web, quelles URL mettre dans le fichier Sitemap XML ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, forums, conférences, etc.). Donc « gossips » (rumeur) + Google = « Goossips » 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

  

Noms de sites identiques
Gary Illyes a expliqué sur LinkedIn qu'il était important, lorsqu'un site a du contenu dupliqué interne, d'indiquer dans le Sitemap XML l'URL des pages canoniques pour aider Google à bien faire la distinction entre canoniques et dupliquées : « Il est normal d'avoir du contenu dupliqué sur votre site, mais si vous voulez donner aux moteurs de recherche autant d'indices que possible sur la version qui doit être canonique (c'est-à-dire affichée dans les résultats de recherche), le fichier Sitemap XML est l'un de ces indices. Il n'est pas aussi fort que la balise "canonical", mais il peut tout de même être utile. »...
Source : Search Engine Roundtable
Taux de fiabilité :
Un petit rappel ne fait jamais de mal. C'est en effet l'une des recommandations faites par Google pour les Sitemaps XML (on ne met dans le fichier Sitemap XML que l'URL canonique et pas les URL dupliquées), en plus du fait que toutes les URL de ce fichier doivent être indexables : pas de 3xx, 4xx, 5xx ou "noindex" également. Voir notre vidéo à ce sujet...

 

Goossips : URL Canonique et Sitemap XML
Goossips : URL Canonique et Sitemap XML. Source : Google