Un sitemap, littéralement "plan de site" en français, est un fichier XML qui énumère toutes les pages d'un site web. Il sert de guide pour les moteurs de recherche, leur indiquant quelles pages sont disponibles et comment elles sont structurées.

Histoire du Sitemap

Origine du sitemap par Google (2005)

En 2005, face à l'expansion rapide du Web et à la nécessité d'une meilleure indexation des sites, Google a introduit le concept de sitemap sous la forme d'un fichier XML et TXT.

L'objectif était de fournir aux propriétaires de sites un moyen de transmettre des informations sur leurs pages à Google, notamment celles qui pourraient ne pas être découvertes automatiquement par le crawler de Google.

Ce fichier permettait d'indiquer les pages importantes d'un site, leur fréquence de mise à jour, leur priorité par rapport aux autres, etc.

Évolution et adoption par d'autres moteurs de recherche

L'initiative de Google a rapidement fait écho dans le monde du web. Voyant l'efficacité du sitemap pour améliorer l'indexation, d'autres moteurs de recherche majeurs, comme Bing et Yahoo, ont adopté cette norme.

Ainsi, le sitemap est devenu un outil universel permettant une communication plus fluide entre les webmasters et les moteurs de recherche.

Au fil des années, les sitemaps ont évolué pour prendre en compte différents types de contenus, tels que les vidéos, ou les images.

Des extensions au format sitemap ont été créées pour traiter ces types spécifiques de contenus, rendant les sitemaps encore plus pertinents et utiles pour le SEO.

Organisation d’un sitemap

Un sitemap contient tous les documents (en d’autres termes, les pages web) d’un site et les présente de manière hiérarchique. Cela signifie que la structure de l’ensemble du site est fidèlement dupliquée dans cette synthèse.

Pour comprendre le sitemap, il faut avoir pris le temps de se familiariser avec la structure des sites web : un site web standard est composé de documents HTML individuels, stockés dans divers dossiers et interconnectés par des liens hypertextes. Toutes ces données sont stockées dans l’espace Web.

Dans le sitemap, les pages sont enregistrées avec les URL correspondantes.

Types de sitemaps

Sitemaps HTML (Langage de balisage hypertexte) 

Description : Ce sont des pages web destinées principalement aux visiteurs humains. Ils offrent une vue structurée des différentes sections et pages d'un site web, souvent sous forme de liste hiérarchisée.

Utilisation : Idéal pour les utilisateurs souhaitant naviguer et comprendre la structure globale du site. Ils peuvent être particulièrement utiles pour les sites très fournis ou complexes.

Avantages : Facilité de navigation pour les visiteurs et amélioration de l'expérience utilisateur.

Sitemaps XML (Langage de balisage extensible)

Description : Ce format est destiné aux moteurs de recherche. Il offre une liste des URLs disponibles pour l'indexation, avec des informations supplémentaires comme la fréquence de mise à jour ou la priorité de chaque page.

Utilisation : Il guide les moteurs de recherche à travers le contenu du site et aide à l'indexation. C'est un élément clé pour le SEO.

Avantages : Accélération de l'indexation des pages par les moteurs de recherche. Possibilité d'ajouter des informations métadonnées pour chaque URL.

Sitemaps en TXT

Description : Le sitemap au format .txt est une autre manière simple de présenter les URL d'un site web aux moteurs de recherche. Il est moins courant que le format XML mais il est toujours accepté par certains moteurs de recherche, notamment Google.

Utilisation : Contrairement au sitemap XML qui peut contenir des métadonnées sur chaque URL (comme la fréquence de mise à jour ou la priorité), le sitemap .txt est juste une liste simple d'URLs. Chaque URL est écrite sur une nouvelle ligne.

Avantage : Même si le sitemap .txt est accepté, le sitemap XML est généralement préféré car il fournit plus d'informations aux moteurs de recherche. Cependant, pour des sites simples ou si vous voulez juste un moyen rapide de soumettre vos URLs à Google, le sitemap .txt peut être suffisant et plus facile à concevoir. Vous pouvez facilement créer un sitemap .txt à l'aide d'un éditeur de texte standard comme Notepad (Bloc-notes) ou TextEdit. Il suffit de lister chaque URL de votre site web sur une nouvelle ligne.

Dans la suite de cette définition, nous traiterons principalement du sitemap à destination des moteurs de recherche dans le cadre du SEO : le sitemap XML.

Pourquoi le sitemap est-il crucial en SEO ?

Imaginons un livre : si les pages du livre sont les différentes pages de votre site web, alors le sitemap en est la table des matières. Ce sitemap joue un rôle essentiel dans l'optimisation pour les moteurs de recherche (SEO) pour plusieurs raisons :

Indexation améliorée

Les moteurs de recherche, comme Google, utilisent les sitemaps comme un guide pour indexer le contenu d'un site web. Cela garantit que les pages soient prises en compte et explorées, même si elles ne sont pas facilement accessibles via les liens traditionnels du site.

Mise à jour rapide

À travers le sitemap, vous pouvez informer les moteurs de recherche des mises à jour, des nouvelles pages ajoutées ou des modifications apportées à votre site. Cela aide à maintenir votre contenu à jour dans les résultats de recherche.

Organisation et hiérarchie

Les sitemaps permettent aux moteurs de recherche de comprendre la structure et la hiérarchie de votre site, ce qui contribue à améliorer la qualité de l'indexation. 

En ce sens, la balise <loc> a pour rôle principal d'indiquer l'URL exacte d'une page spécifique du site. Elle est la seule balise obligatoire dans un sitemap.

Grâce à cette balise, les moteurs de recherche savent précisément où se trouvent les ressources mentionnées dans le plan de site.

Voici comment elle est généralement utilisée dans un sitemap :

<url>

  <loc>https://www.example.com/page1</loc>

</url>

Dans cet exemple, la balise <loc> contient l'URL de la page "page1" du site "www.example.com". Lorsque les moteurs de recherche parcourent le sitemap, ils utilisent cette balise pour identifier et accéder à la page en question.

Dernière modification

Dans un sitemap, il est pertinent d'informer les moteurs de recherche sur la date de la dernière modification d'une page surtout pour les mises à jour importantes.

Pour cela, la balise <lastmod> est employée. Cette balise facultative donne aux moteurs de recherche la capacité de juger à quelle fréquence ils devraient explorer votre site. Voici un exemple d’utilisation de cette balise dans un sitemap : 

<url>

   <loc>https://www.votresite.com/page-exemple/</loc>

   <lastmod>2023-08-30</lastmod>

</url>

On utilise généralement le format AAAA-MM-JJ pour plus de simplicité.

Priorisation du contenu

Dans un sitemap, vous pouvez indiquer la priorité de certaines pages par rapport à d'autres, guidant ainsi les moteurs de recherche sur les pages que vous estimez les plus importantes.

Pour cela, il est possible d’utiliser la balise <priority>. Cependant, il est à noter que cette balise n’est pas prise en compte par Google : il n’est donc pas indispensable de la préciser.

Fréquence de modification

Vous pouvez spécifier à quelle fréquence une page est généralement mise à jour (quotidienne, hebdomadaire, mensuelle...). Cela aide les moteurs de recherche à déterminer la fréquence d'exploration de cette page.

Pour cela, on utilise la balise optionnelle <changefreq>. Cette balise sert uniquement d’indication pour les moteurs de recherche et n’est pas toujours respectée par les robots d’exploration.

Versions multilingues

Si votre site est disponible dans plusieurs langues, le sitemap peut indiquer les différentes versions linguistiques d'une page. Cela permet d'offrir aux utilisateurs des résultats pertinents selon leur langue.

Transmettre des informations spécifiques selon le type de contenu

Les vidéos : 

Durée : Indique la longueur totale de la vidéo. Cela peut aider les utilisateurs à décider s'ils souhaitent la regarder ou non.

Notation : Il s'agit de la note attribuée à la vidéo, généralement basée sur les avis des utilisateurs ou des critiques. Elle donne une idée de la qualité ou de la pertinence de la vidéo.

Audience ciblée : Cette information précise à quel groupe démographique ou à quel type d'utilisateur la vidéo est destinée. Cela peut être utile pour les moteurs de recherche afin d'afficher la vidéo aux utilisateurs pertinents.

Les images : 

Emplacement sur une page : Le sitemap peut spécifier où, exactement sur la page, l'image est située. Cela permet aux moteurs de recherche d'indexer l'image dans le bon contexte, améliorant ainsi la pertinence des résultats de recherche.

Les articles d’actualité

Titre : Le titre de l'article donne une idée rapide du sujet ou du contenu de l'article.

Date de publication : La date à laquelle l'article a été publié. Cette information est essentielle pour comprendre la pertinence temporelle de l'article, surtout dans le cadre des actualités ou des sujets évolutifs.

Quand est-il recommandé d'utiliser un sitemap ?

Pour les sites vastes

Un grand site avec des milliers de pages peut ne pas être entièrement exploré par les moteurs de recherche. Dans ce cas, le sitemap garantit que les moteurs de recherche sont informés de toutes les pages. 

Attention : le sitemap est un plan de site, il ne permet pas de bloquer les robots crawler ou de les empêcher d’indexer certaines pages. Pour limiter l’accès des robots d’exploration et contrôler l’indexation de votre site, il est nécessaire d’utiliser un fichier robots.txt. C’est également ce fichier qui vous permettra d’avoir un meilleur contrôle de votre budget crawl, surtout si votre site est très volumineux.

Pour les sites récemment créés avec peu de liens externes

Un nouveau site web n'a généralement pas beaucoup de liens externes menant vers lui. Le sitemap peut aider les moteurs de recherche à découvrir le site plus rapidement.

Pour les sites avec un contenu riche en médias

Si votre site contient de nombreux médias, tels que des vidéos, des images, ou s'il est régulièrement mis à jour avec des actualités, un sitemap peut fournir des informations précieuses sur ces contenus pour une meilleure indexation, et potentiellement, un meilleur référencement.

Dans quels cas l'utilisation d'un sitemap n'est-elle pas prioritaire ?

Pour les sites de petite à moyenne taille

Si votre site a une structure simple et qu'il n'est pas trop volumineux, les moteurs de recherche peuvent souvent l'indexer efficacement sans l'aide d'un sitemap.

Pour les sites avec une navigation claire

Si chaque page de votre site est accessible à partir d'une autre page via des liens hypertexte, le sitemap devient moins essentiel. Pour faciliter la navigation des utilisateurs (et également l’exploration des robots), une bonne pratique consiste à faire en sorte que chaque page d’un site soit accessible à 3 clics maximum de la page d’accueil.

Pour les sites sans intention d'indexer la majorité de leur contenu multimédia ou de leurs actualités

Si vous n'avez pas l'intention d'indexer certains contenus spécifiques, ou si vous ne voulez pas que les moteurs de recherche accordent une attention particulière à certains types de pages, un sitemap n'est pas forcément nécessaire.

Comment créer un sitemap ?

Utiliser des outils en ligne

Il existe de nombreux outils en ligne gratuits et payants qui peuvent générer un sitemap pour votre site web en quelques clics. Vous devrez simplement saisir l'URL de votre site, et l'outil s'occupera du reste.

Exemple d'outils populaires : XML-Sitemaps.com, SEOSiteCheckup, et Ahrefs.

Plugins et extensions pour les systèmes de gestion de contenu

Si votre site web est basé sur une plateforme de gestion de contenu (CMS) comme WordPress, il existe de nombreux plugins qui peuvent générer un sitemap pour vous.

Pour WordPress, l'un des plugins les plus populaires est "Yoast SEO". Une fois installé, il peut automatiquement créer et mettre à jour un sitemap pour votre site.

D'autres plateformes, comme Joomla ou Drupal, proposent également des extensions similaires pour la génération de sitemaps.

Création manuelle (pour les utilisateurs avancés) :

Si vous avez des compétences techniques et que vous souhaitez un contrôle total sur votre sitemap, vous pouvez le créer manuellement. Cela implique de rédiger un fichier XML qui respecte les normes établies pour les sitemaps.

Dans ce fichier, vous listerez toutes les URLs de votre site, ainsi que des informations facultatives comme sa date de dernière mise à jour, la fréquence de mise à jour de chaque page ou sa priorité par rapport aux autres.

Comment soumettre un Sitemap à Google ?

Utilisation de Google Search Console

  • Créez un compte et connectez-vous à Google Search Console. Si vous n'avez pas encore de compte, rendez-vous sur le site de la Google Search Console et inscrivez-vous.
  • Ajoutez et vérifiez votre site : Une fois connecté, cliquez sur "Ajouter une propriété" et suivez les instructions pour vérifier que vous êtes bien le propriétaire du site web. Il y a plusieurs méthodes de vérification disponibles, comme l'ajout d'un fichier à votre site ou la vérification via votre fournisseur de domaine.
  • Soumettez votre sitemap : Une fois votre site vérifié, allez dans le menu latéral, cliquez sur "Sitemaps". Dans le champ prévu à cet effet, entrez l'URL de votre sitemap (généralement sous la forme "votresite.com/sitemap.xml") et cliquez sur "Soumettre".

Suivi de l'indexation de votre site par Google

  • Consultez le rapport sur les sitemaps : Après avoir soumis votre sitemap, retournez régulièrement sur Google Search Console pour consulter le rapport sur les sitemaps. Cela vous donnera des informations sur le nombre de pages soumises via le sitemap et le nombre de pages indexées par Google.
  • Surveillez les erreurs d'indexation : Dans cette section, Google vous informera de toutes les erreurs rencontrées lors de l'indexation de votre site. Si des erreurs sont détectées, il est crucial de les corriger rapidement pour garantir une bonne visibilité de votre site dans les résultats de recherche.
  • Mettez à jour régulièrement votre sitemap : Si vous ajoutez, modifiez ou supprimez des pages sur votre site, pensez à mettre à jour votre sitemap et à le soumettre à nouveau via Google Search Console.

Astuces et bonnes pratiques

À quelle fréquence mettre à jour son sitemap ?

Mise à jour régulière : Il est essentiel de mettre à jour votre sitemap chaque fois que vous ajoutez, modifiez ou supprimez une page sur votre site. Une mise à jour régulière assure que les moteurs de recherche sont toujours informés des dernières modifications.

Automatisation : Utilisez des outils ou des plugins, selon la plateforme que vous utilisez, pour automatiser la mise à jour de votre sitemap. Cela vous permet de ne pas avoir à le faire manuellement à chaque modification.

Comment éviter les erreurs courantes ?

Éviter les URL dupliquées : Assurez-vous que chaque URL dans votre sitemap est unique pour éviter les contenus dupliqués et les erreurs d’indexation.

Respect de la structure XML : Assurez-vous que votre sitemap respecte la structure XML correcte. Les erreurs de formatage peuvent entraîner des problèmes d'indexation.

Surveillance des erreurs via Google Search Console : Connectez-vous régulièrement à Google Search Console pour surveiller les erreurs potentielles liées à votre sitemap. Corrigez rapidement toute erreur signalée.

Limitation du nombre d'URLs : Un sitemap ne doit pas contenir plus de 50 000 URLs ou être supérieur à 50 MB. Si votre site est plus grand, vous pouvez diviser votre sitemap en plusieurs fichiers. Il est possible de créer un fichier d’index de sitemaps pour regrouper ces différents sitemaps.

Quelles URLs indiquer dans un sitemap ?

Gardez à l'esprit qu'un sitemap sert de guide pour les moteurs de recherche. Afin d’optimiser l'indexation de votre site, ne listez dans le sitemap que les pages que vous souhaitez véritablement voir indexées.

En excluant les pages secondaires ou moins pertinentes, vous aidez les moteurs de recherche à se concentrer sur le contenu le plus important de votre site, améliorant ainsi sa visibilité et son positionnement dans les résultats de recherche. C'est une pratique recommandée pour assurer une indexation efficace et pertinente.

Optimisation pour d'autres moteurs de recherche

Bing & Yahoo : Bien que Google soit le moteur de recherche dominant, d'autres moteurs comme Bing et Yahoo sont également importants. Soumettez également votre sitemap via le portail Bing Webmaster Tools, qui couvre à la fois Bing et Yahoo.

Adaptation aux spécificités : Certains moteurs de recherche peuvent avoir des spécificités. Renseignez-vous sur ces particularités et, si nécessaire, créez des sitemaps adaptés à chacun.

Normes universelles : Assurez-vous que votre sitemap respecte les normes établies par le consortium Sitemaps.org. Cela garantit qu'il sera compatible avec la majorité des moteurs de recherche.