10 raisons qui rendent les Sitemaps XML vraiment inutiles !

Cela fait 10 ans que les Sitemaps XML existent. Une bonne occasion pour faire un point sur ce sujet. La semaine dernière, nous avons listé 10 raisons qui les rendent réellement indispensables. Aujourd'hui, nous regardons celles qui font que ces fichiers sont totalement inutiles. Et nous concluons : les Sitemaps ont-ils un intérêt ou pas ?...

Rappelons que la plupart des moteurs de recherche majeurs se sont entendus, en 2005, sur un format XML nommé Sitemaps, proposant une liste d'URL agrémentée de certaines informations (date de dernière modification, fréquence de mise à jour, priorité d'indexation, etc.)

10 ans après l'apparition de cette fonctionnalité, il nous a semblé intéressant de faire un point à ce sujet : les Sitemaps XML sont-ils indispensables ou inutiles ? La semaine dernière, nous avons essayé de lister les aspects positifs des Sitemaps. Voici donc un avis contraire de l'autre côté de la balance, avec 10 arguments qui rendent ces fichiers XML inutiles. Ou presque...

Pourquoi les Sitemaps XML sont inutiles

1. Tout d'abord, il est clair et net que les Sitemaps XML ne servent absolument pas à obtenir un meilleur classement dans les résultats de Google. Ils n'ont tout simplement pas été conçus pour ça. Leur but est éventuellement d'obtenir une meilleure indexation des pages d'un site, mais ils n'ont aucun impact sur le positionnement.

2. La création d'un fichier Sitemap XML n'est en rien une garantie d'indexation pour les URL qui y sont soumises. Vous proposez, Google dispose !

3. Ces fichiers contiennent, pour chaque page, une URL (champ <loc>) qui est obligatoire, et plusieurs champs facultatifs : fréquence de mise à jour (<changefreq>), date de dernière mise à jour (<lastmod>) et priorité d'indexation (<priority>) entre autres. Sincèrement, on peut clairement se poser la question de l'utilité de ces champs facultatifs puisqu'en règle générale, ils ne reflètent pas la réalité (comment établir une fréquence de mise à jour fiable pour une page donnée, à part quelques cas particuliers ?) ou ce sont des données que Google possède déjà par ailleurs (date de dernière modification). Quant à la priorité d'indexation, honnêtement, Google l'a-t-il un jour prise en compte et si oui, pourquoi ?? Bref, à part l'URL, les autres champs sont, à notre avis et avec un certain recul, inutiles. Un fichier Sitemap au format texte (.txt), listant les différentes URL du site, est à nos yeux largement suffisant...

4. On entend souvent dire que le Sitemap sert à indexer des pages "orphelines", qui ne se trouvent pas dans l'arborescence du site. Peut-être. Eventuellement. Pourquoi Pas ? Mais si votre site a ainsi des pages orphelines, c'est peut-être qu'il a quelques carences au niveau de sa conception, vous ne croyez pas ? Le but et l'objectif d'un fichier XML n'est pas de corriger les erreurs de conception d'un site web. Dans ce cas, il vaut bien mieux avant tout corriger la navigation pour inclure ces pages isolées dans la navigation naturelle plutôt que de compter sur la « rustine Sitemap » pour corriger le tir.

5. Idem pour les pages profondes, atteignables à partir de 4 à 5 clics depuis la page d'accueil. Si elles sont trop profondes dans l'arborescence, il est loin d'être sûr qu'un fichier Sitemap améliorera la situation en termes de crawl. Encore une fois, ces fichiers ne sont pas là pour corriger vos erreurs de conception...

6. Pour les « petits » sites (moins de 10 000 URL indexées), un Sitemap ne sert sincèrement pas à grand chose, par expérience. Google privilégiera de toutes façons toujours la navigation naturelle en suivant les liens de l'arborescence pour crawler un site. Un plan du site pour les internautes (des pages HTML donc, conçues également pour vos visiteurs, comme ceci) bien réalisé mettra toutes les pages importantes à 3 clics maximum de la page d'accueil, permettra un crawl optimisé par les moteurs et sera bien plus efficace que tous les Sitemaps XML de la Terre !

7. Les Sitemaps XML contiennent souvent des erreurs, dûes à de nombreuses raisons, souvent techniques. C'est donc un peu dommage de fournir ainsi des URL erronées à crawler à Googlebot...

8. Dans sa Search Console, Google ne donne pas le détail des pages crawlées et (non) indexées, ce qui est réellement dommage. Dans la zone "Exploration > Sitemaps", on aimerait connaître la liste des URL du Sitemap qui ne sont pas indexées pour en comprendre la raison et corriger les problèmes éventuels. Mais elle n'est pas disponible. Du coup, c'est un des intérêts principaux des Sitemaps qui devient caduc.

9. Les Sitemaps « basiques » sont souvent gérés par défaut et sans problème par les CMS du marché. Il n'en est pas toujours de même pour ceux dédiés à Google News, au mobile, aux images, aux vidéos, etc. Cela génère donc des développements (certes pas monumentaux) qui peuvent s'avérer assez coûteux en temps/homme. Est-ce vraiment rentable ?

10. Argument souvent entendu également : un Sitemap sert à faire le travail du moteur de recherche à sa place. Normalement, les robots des moteurs doivent être capables de crawler un site sans qu'on leur fournisse un fichier pour les y aider. C'est pas faux... 🙂

Conclusion : alors, les Sitemaps XML, utile ou pas utile ?

Nous avons donc listé dans ces deux articles les différents arguments « Pour » ou « Contre » les Sitemaps. Nous pouvons alors en tirer quelques conclusions (toutes personnelles) :
- Les Sitemaps existent (et ont le mérite d'exister), il est donc dommage de ne pas les utiliser.
- Ils sont surtout intéressants pour les gros sites (plus de 10 000 URL). Pour les sites plus petits, un plan du site pour les internautes bien réalisé et optimisé suffira la plupart du temps.
- Ils sont également intéressants pour les formats comme les images, les vidéos, le mobile, les sites internationaux, etc.
- Un Sitemap n'est réellement intéressant que s'il est utilisé intelligemment, avec toutes les fonctionnalités avancées qu'il peut apporter.
- Les champs facultatifs (fréquence de mise à jour, date de dernière modification, priorité) n'ont qu'un intérêt très (très) limité. Autant les supprimer plutôt que de fournir des informations erronées ou inutiles.
- Le fait de pouvoir suivre l'indexation des URL soumises dans la Search Console est un réel avantage s'il est bien utilisé. Mais il est dommage que le détail des URL non indexées ne soit pas disponible.
- Les Sitemaps ne sont pas conçus pour corriger les carences de conception d'un site web.

Voilà, sur cette base, à vous maintenant de vous faire votre opinion. Merci pour votre lecture et à Vos Sitemaps. Ou pas... 🙂

Sitemaps
Source de l'image : DR