Cela fait 10 ans que les Sitemaps XML existent. Une bonne occasion pour faire un point et lister, pour commencer, 10 raisons qui les rendent réellement indispensables à tout éditeur de site web. Vraiment ??...
La plupart des moteurs de recherche majeurs se sont entendus, en 2005, sur un format XML nommé Sitemaps, proposant une liste d'URL agrémentée de certaines informations (date de dernière modification, fréquence de mise à jour, priorité d'indexation, etc.)
10 ans après l'apparition de cette fonctionnalité, il nous a semblé intéressant de faire un point à ce sujet : les Sitemaps XML sont-ils vraiment indispensables ? Et si oui, pour quels types de sites ? Nous avons donc essayé de lister les aspects "pour" et "contre" dans plusieurs articles successifs afin de mettre chaque argument dans la balance et nourrir ainsi votre réflexion. Aujourd'hui, nous allons donc traiter des aspects positifs et des points réellement intéressants qui ont été apportés, historiquement, par ce format de fichier.
Les aspects positifs des Sitemaps XML
1. En aucun cas, la création d'un Sitemap n'est négative pour un site web, même si ce fichier est vide, ou construit n'importe comment, générant de nombreuses erreurs lors de l'analyse par Google. En d'autres termes, ça ne mange pas de pain d'en créer un (ou plusieurs) et si ça ne fait pas de bien, ça ne fera de toutes façons pas de mal... C'est déjà ça de pris. 🙂 Et puis, après tout, pour une fois que les moteurs nous donnent un outil permettant de mieux gérer une situation, autant en profiter, non ?
2. Cela permet de donner aux moteurs de recherche principaux un listing exhaustif (si le Sitemap est bien fait) de vos URL, ce qui est une bonne chose. Ou en tout cas un listing exhaustif des pages que vous estimez utiles à l'indexation. Même si Google, qui est une incroyable machine à crawler, n'en aura que peu besoin, d'autres moteurs (on pense notamment à Bing) qui n'ont pas les moyens techniques du moteur leader, pourront s'en servir à bon escient. Et puis, pour les gros sites (plusieurs centaines de milliers d'URL voire plus), cela peut représenter un vrai "plus" en termes d'indexation, même pour Google. En tout cas, cela permet, quelque part, de se donner bonne conscience en se disant qu'on a fourni toutes ses URL au moteur. A lui de se débrouiller derrière pour faire son boulot...
3. Les différents types de Sitemaps ont souvent un intérêt reconnu par la plupart des SEO : News, mobile, vidéos. Le Sitemap XML "classique" permet également de fournir les URL de vos images aux moteurs dédiés à ce type de format. Idem pour les différentes versions "pays/langues" d'un site grâce à l'option Hreflang. Et pour les URL canoniques, etc. Les signaux à l'attention des moteurs passant par les Sitemaps sont, finalement, devenus assez nombreux au fil des ans...
4. La Search Console de Google vous permet de suivre l'indexation (ainsi que son historique sur les dernières semaines) de votre (ou vos) Sitemap(s). Vous avez ainsi la possibilité de vérifier combien d'URL, parmi celles proposées, sont réellement indexées avec une fiabilité qui est devenue assez bonne au fil du temps.
5. Les messages d'erreur éventuellement renvoyés dans la Search Console - après analyse par Google de vos Sitemaps - peuvent vous permettre de corriger certains points qui vous auraient échappé par ailleurs sur votre site.
6. Pour les gros sites, il est possible de créer plusieurs Sitemaps pour suivre leur indexation respective dans la Search Console. Par exemple, pour une boutique en ligne : un Sitemap par gamme de produit. Ou pour un site de contenu : un Sitemap par rubrique du menu. Ou pour un site d'actualité : un Sitemap par année d'archive, etc. Ou un fichier par format (Html, Pdf...). Etc. La Search Console permettra alors de vérifier qu'il n'existe pas de "trou d'indexation" dans l'une ou l'autre partie du site et de le corriger éventuellement. Intéressant...
7. Il est possible de déclarer un fil RSS comme fichier Sitemap. Cela peut être intéressant pour fournir les dernières actualités du site aux moteurs.
8. La création et la maintenance de ces fichiers est aujourd'hui enfantine. La plupart des CMS actuels savent gérer le format Sitemap de façon simple, rapide et automatisée. Finie les fichiers créés à la mano ou via un générateur de type "robots/crawlers", ne donnant qu'une image à un temps T des URL de votre site, sans mise à jour automatique.
9. Et même si votre CMS date de la préhistoire et ne gère pas ces fichiers, Bing propose un outil de création de Sitemap en Open Source.
10. Lors d'une migration de site avec changement d'URL, une gestion fine des fichiers Sitemaps respectifs (ancienne et nouvelle version des URL) peut également permettre de suivre de façon "intelligente" le couple désindexation/indexation lors de la refonte.
A bientôt pour le revers de la médaille !
Voici donc listés 10 raisons qui font selon nous qu'un fichier Sitemap est intéressant à mettre en place pour votre site. En voyez-vous d'autres ? Si oui, n'hésitez pas à les indiquer en commentaires !
Dans notre prochain article, nous évoquerons le pendant négatif de cette liste, c'est-à-dire les 10 arguments qui font, cette fois, que les Sitemaps sont inutiles. Avant de conclure en mettant tout cela de chaque côté de la balance afin de faire le meilleur choix possible. Mais la vie numérique est-elle si manichéenne que cela ? Nous aurons prochainement l'occasion d'en reparler... A très bientôt donc pour la suite !
Source de l'image : DR |
Mon commentaire visait avant tout Serge. J’attends de lire la suite.
@ Denis : je n’ai jamais dit que les Sitemaps étaient de nature à pénaliser le SEO ??
@Serge, @Olivier
Je ne comprends pas bien en quoi une technique censée accélérer l’exploration et par ricochet l’indexation est de nature à pénaliser le SEO.
Les sitemap sont particulièrement importants pour Baidu aussi (même si je sais qu’il ne s’agit pas de ce moteur de recherche dans l’article). Les ETags sont également des éléments importants permettant à Baidu de découvrir les sitemap plus rapidement.
Certes ça pèse pas lourd, mais sur un gros site, ça peut permettre d’aller chercher un peu de croissance.
Tout comme l’avantage de découper le sitemap par grandes familles de pages. Pour ma part ça me donne de la visibilité.
Je note aussi au passage l’intérêt particulier pour Bing.
@ Khadija Bouhaouala : il faut attendre l’article Abondance sur les « 10 raisons qui rendent les Sitemaps inutiles » pour se faire une idée. Mais globalement, l’article de Creapulse n’est pas contradictoire avec ce que je dis (ou dirai 🙂 ) .
Olivier, le sujet des sitemaps est effectivement incontournable quand on fait du SEO et que l’on souhaite faciliter / diriger le crawl des robots.
Tu fais assez bien ressortir l’intérêt de pouvoir suivre, via la search console, ce que Google fait de ces données: taux de pages indexées / nombre de pages fournies, erreurs éventuelles, … Tout comme l’avantage de découper le sitemap par grandes familles de pages. Pour ma part ça me donne de la visibilité.
Je note aussi au passage l’intérêt particulier pour Bing. Certes ça pèse pas lourd, mais sur un gros site, ça peut permettre d’aller chercher un peu de croissance.
Dans les faits, Google a beau indexer les millions de pages fournies dans un sitemap, ce n’est pas pour autant qu’il les juge pertinentes et les ajoute à son index principal, mais c’est un autre problème.
Alors finalement, l’article polémique qui devrait nous faire réagir sera du type « pourquoi il ne faut pas avoir de sitemap.xml »! Je le lirai avec intérêt…
Bonjour,
Merci pour cet article. Est ce qu’il vient en opposition avec un article où il est dit que le sitemap ne favorise par le SEO?
http://www.creapulse.fr/le-sitemap-xml-cest-pas-bon-pour-le-seo/
En parlant de sitemap, je viens d’en trouver un de 184 Mo : http://commercecentral.yahoo.com/sitemap.xml ! Je pense que le webmaster ou le référenceur ferait bien de venir lire le point 6 de cet article !
@ serge esteves : rendez-vous donc au prochain article 🙂
« Tu dis que tu vas donner dans un prochain article, les aspects négatifs du sitemap XML »
> Je parlerai surtout des arguments qui rendent les Sitemaps inutiles surtout !
Cdt
Tu dis que tu vas donner dans un prochain article, les aspects négatifs du sitemap XML, mais ton premier point est que, je te cite: « En aucun cas, la création d’un Sitemap n’est négative pour un site web »
J’ai hâte de voir comment tu vas t’en sortir dans ce prochain article pour ne pas te contredire 😉
En plus t’y vas fort: « même si ce fichier est vide, ou construit n’importe comment, générant de nombreuses erreurs lors de l’analyse par Google »
Ou quand tu dis: »Même si Google, qui est une incroyable machine à crawler, n’en aura que peu besoin »
Google crawle pas si bien que ça, et en tout cas pas forcément ce qu’on a envi qu’il crawle, et de toute façon le sitemap va pas forcément aider à indexer et encore moins à rendre les pages actives. Et si Google n’en aura que peu besoin, ça veux dire que c’est surtout utile pour les autres moteurs ? Quid de l’utilité du sitemap alors, Vu que Google c’est 90% de la part de marché des moteurs.
Je réagis aussi car je viens juste d’envoyer un article sur mon site qui donne justement les aspects négatifs du sitemap XML:
http://www.creapulse.fr/le-sitemap-xml-cest-pas-bon-pour-le-seo/
Je pense que ce serait intéressant de confronter nos points de vue.