Un googler a indiqué dernièrement que le moteur de recherche ne prenait pas en compte, dans les fichiers Sitemap XML, le champ indiquant la date de dernière modification d'une page web. Mais ce n'est pas la seule information inutile dans ce type de fichier...
Petite info relayée par le site Search Engine Roundtable avec une intervention du googler Gary Illyes sur le site Stack Overflow, indiquant que les moteurs de recherche ignorent le champ (facultatif) "date de dernière modification" dans les fichiers Sitemap XML qui leur sont soumis.
Voici ce qu'il dit à cette occasion : "The lastmod tag is optional in sitmaps and in most of the cases it's ignored by search engines, because webmasters are doing a horrible job keeping it accurate." On passera sur le fait que, si les moteurs ne lisent pas ce champ, c'est la faute aux webmasters (ben voyons !). Ceci dit il est clair que, plus globalement, la plupart des champs d'information facultatifs sont aujourd'hui inutiles :
- <lastmod> (date de dernière modification) : inutile, comme le dit Gary Illyes : Google a de toutes façons bien d'autres possibilités pour définir cette date.
- <changefreq> (fréquence de mise à jour) : inutile car, dans la majeure partie des cas, impossible à définir. Une page web n'a pas obligatoirement une fréquence de mise à jour prédefinie. Et, là encore, Googlebot se charge sans trop de problème de déterminer cette donnée.
- <priority> (priorité d'indexation) : inutile car, soyons clair, un seul moteur de recherche au monde a-t-il jamais pris en compte cette information ??
Bref, si vous estimez qu'un fichier Sitemap XML est important pour votre site (ce qui reste à démontrer et fera certainement l'objet d'un prochain article ici-même), ne vous embêtez pas plus que cela. Soyez avant tout exhaustif et privilégiez le champ <loc> ainsi que l'indication des images et vidéos si elles sont stratégiques pour votre visibilité, tout comme les balises Hreflang. Et ça sera largement suffisant !
Et, surtout, travaillez à faire en sorte que l'arborescence "naturelle" permette d'atteindre toutes les pages de votre site en 3 ou 4 clics maximum, notamment au travers d'un plan du site (pour les internautes) très détaillé. Et, dans ce cas, vous n'aurez pas à vous poser de multiples questions sur les champs à fournir dans votre fichier Sitemap XML...
Source de l'image : DR |
« On passera sur le fait que, si les moteurs ne lisent pas ce champ, c’est la faute aux webmasters (ben voyons !) » > un peu fort non ? sinon à quoi bon proposer ce type de paramètre ? c’est comme la métadonnée « keywords »… si les gens n’utilisent pas à bon escient…
Le sitemap est avant tout un outil de pilotage de la prise en compte de l’indexation. Le soumettre a SearchConsole, si possible en splittant le sitemap par typologie de pages pour les sites a forte volumetie permet de s’assurer qu’il n’y a pas de trous d’indexation. si il s’avère que telle typologie est en deficit d’indexatin, il sera plus simple d’agir…Voila a quoi sert le sitemap.
@Olivier Andrieu et Ikario : Merci pour vos réponses intéressantes à mon commentaire ! Oui, et grâce à la soumission, il est également possible de voir où est-ce que l’indexation des pages dans le sitemap.xml en est aussi. Je pense que cela reste intéressant de le faire 🙂
Rien de nouveau sous le soleil (il me semble que cela avait été débattue sur des forums de Moz – sans confirmation officielle toutefois) 🙂
@Veronique Duong : a vérifier(dans des logs), mais je ne serais pas étonnée si par défaut, Google envoyait automatiquement une requête (> root.tld/sitemap.xml ou pour yoast par exemple /sitemap_index.xml etc.)…
Et pour l’avoir tester plusieurs fois, la prise en compte reste parcellaire et (trop) diffuse après une soumission dans la SearchConsole. Par contre associé à un feed atom/RSS la rapidité d’indexation est plus certaine !
@ Véronique Duong : la soumission dans la Search Console n’est pas obligatoire si le Sitemap est déclaré dans le fichier robots.txt. Mais disons que c’est complémentaire…
Merci pour cet article qui confirme des idées que j’avais en tête par rapport aux balises changfreq et priority. Les sitemaps images et vidéos, avec les hreflang, me semblent plus intéressants et importants pour le SEO. De plus, la soumission dans Search Console me semble importante.