Après avoir analysé et audité des centaines d'implémentations hreflang au cours de sa carrière professionnelle, Gerry White a constaté des erreurs récurrentes et un certain nombre d’idées reçues à propos de l’attribut hreflang. Voici les pièges les plus communs à éviter si vous voulez réussir votre implémentation !

Qu'est-ce que l’attribut hreflang ?

Avant tout chose, rappelons brièvement en quoi consiste l’attribut hreflang. Ce dernier a été introduit par Google en 2011 pour aider les moteurs de recherche à mieux comprendre la relation entre les différentes versions linguistiques ou régionales d'une page web. Concrètement, hreflang permet d'indiquer explicitement quelle version de la page doit être présentée aux utilisateurs en fonction de leur langue et/ou de leur localisation géographique.

La balise hreflang répond donc à plusieurs objectifs :

  • Éviter le contenu dupliqué : Elle aide Google à comprendre que des pages similaires dans différentes langues ne sont pas du contenu dupliqué, mais des versions légitimes destinées à des audiences spécifiques.
  • Améliorer le ciblage : Elle permet de diriger les utilisateurs vers la version la plus pertinente du contenu en fonction de leur langue et/ou localisation géographique.
  • Optimiser le référencement international : Elle renforce la visibilité des différentes versions linguistiques dans les bons marchés cibles.

A présent, place aux erreurs et pièges à éviter !

1. Penser qu’une approche progressive est impossible

Contrairement à ce que l'on pourrait penser, il n'est pas nécessaire d'avoir une correspondance parfaite entre toutes les pages de votre site dès le départ. Une approche progressive, qui commence par la page d'accueil et les pages les plus importantes du site, comme les catégories principales, est tout à fait valable.

2. Ne pas rendre les pages indexables

L'efficacité de hreflang repose sur des pages correctement indexables. Autrement dit, cela signifie que chaque page doit :

  • Renvoyer un code HTTP 200 OK
  • Être accessible aux robots
  • Disposer d’une balise canonique auto-référente

Les erreurs les plus fréquentes incluent l'utilisation de hreflang sur des pages non-indexables en raison de :

  • Restrictions géographiques limitant l'accès à Google
  • Versions internationales utilisant des paramètres avec des balises canoniques pointant vers la version principale
  • Versions linguistiques gérées par cookies plutôt que par URLs distinctes
  • Présence de paramètres de tracking ou de session

3. Prendre l’attribut hreflang pour une directive absolue

Il faut comprendre que l’attribut hreflang est un signal puissant pour Google, mais en aucun cas une directive absolue. Le moteur peut donc choisir de l'ignorer en fonction d'autres signaux qu’il a à sa disposition, comme les backlinks externes, internes ou d'autres facteurs contradictoires. Cette nuance est importante à garder à l’esprit lors du diagnostic de problèmes d'implémentation.

4. Sous-estimer le nombre d’URLs à crawler

L'ajout de versions linguistiques multiplie considérablement le nombre d'URLs à crawler. Pour un site e-commerce, ajouter trois langues triple le nombre d'URLs, sans compter l’impact des filtres à facettes. Les sitemaps XML spécifiques à hreflang peuvent aider, mais le processus d'indexation prend du temps, particulièrement pour les nouveaux sites disposant d’une autorité limitée.

5. Ne pas respecter la hiérarchie langue/région

Hreflang a été initialement conçu pour gérer les langues, avant les régions. Il est donc recommandé de commencer par le ciblage linguistique avant d'affiner par région.

Par exemple :

  • Espagnol général : /es/
  • Espagnol mexicain : /mx/
  • Espagnol d'Espagne : /es/

Il vaut mieux être trop explicite et précis que pas assez, car Google peut parfois éprouver des difficultés à déterminer la langue ou la région sans hreflang, même si cela relativement rare.

6. Ne pas utiliser les bons codes/normes

Malgré une certaine souplesse dans le domaine, il est indispensable d’utiliser les bonnes normes ISO pour ne pas induire Google en erreur :

  • ISO-639-1 pour les langues
  • ISO-3166-1 pour les régions

Par ailleurs, parmi les erreurs courantes, on retrouve l’utilisation de « CH » pour la Chine (au lieu de « CN ») ou « UK » pour le Royaume-Uni (au lieu de « GB »).

7. Mal placer les balises dans le Head

Les balises hreflang doivent impérativement être placées dans la section <head> du document HTML. De même, attention à ne pas placer d’éléments dans la section <head> des éléments normalement destinés à la section <body>, au risque de compromettre la validité du code.

8. Ne pas utiliser de balises retour sur les pages cibles

L'absence de balises hreflang réciproques sur toutes les pages cibles rend l'implémentation inefficace. Ce problème survient le plus souvent dans les organisations où ce sont des équipes différentes qui gèrent les différentes versions du site.

9. Il n’y a pas de balises d’auto-référencement

Comme pour les balises canoniques, chaque page doit inclure une balise hreflang qui pointe vers elle-même. Cela permet d’indiquer explicitement au moteur quelle est la version linguistique/régionale de la page actuelle.

10. Les signaux sont incohérents

Les signaux hreflang doivent être cohérents à travers les différents supports (XML sitemaps, code HTML) et alignés avec le contenu des pages. Des signaux contradictoires, comme un contenu dans la mauvaise langue, peuvent compromettre l'efficacité de l'implémentation.