Dans un récent épisode de Search Off The Record, plusieurs figures de Google, dont Zoe Clifford de l’équipe rendering, ont discuté de la manière dont Google procédait au rendu des sites qui contiennent beaucoup de JavaScript. On apprend notamment que Google indexe désormais toutes les pages HTML, même lorsqu’elles ont lourdement recours au JavaScript.
Ce qu'il faut retenir :
- Google génère un rendu de toutes les pages HTML, y compris les pages riches en JavaScript.
- Googlebot utilise toujours la dernière version stable de Chrome pour assurer un rendu optimal.
- Malgré un processus de rendering gourmand en ressources, Google s’est engagé à garantir une indexation complète.
- Même si Google parvient à interpréter le JavaScript, il reste important de soigner la rapidité et la simplicité de son site.
Toutes les pages HMTL riches en JavaScript indexées
Selon Zoe Clifford, membre de la team rendering chez Google, toutes les pages HTML, y compris celles riches en JavaScript, sont intégralement rendues et indexées. Cette approche, expliquée dans un épisode du podcast Search Off The Record, représente une avancée importante dans le référencement des sites dynamiques.
Le rendu des pages (ou rendering en anglais) implique l’utilisation d’un navigateur headless. Ce dernier permet à Google d’indexer le contenu tel qu’un utilisateur le verrait après l’exécution du JavaScript et le chargement complet de la page. Zoe Clifford explique que ce processus est indispensable afin de restituer l’intégralité du contenu des sites modernes.
Depuis 2019, Google utilise Evergreen Googlebot, une version de Googlebot qui est constamment mise à jour avec la dernière version stable de Chrome. Cette mise à jour permet à Google de mieux rendre et indexer les sites modernes, en s'assurant que le bot reste en phase avec les évolutions du web.
- Envie d’en savoir plus au sujet du rendering ? Il y a quelques années, Daniel Roch nous proposait un article complet sur la phase de rendering des moteurs de recherche sur Reacteur.
Un processus coûteux, mais nécessaire
L’une des principales révélations du podcast est le fait que Google rend toutes les pages HTML, indépendamment de leur complexité, et même si elles reposent sur une utilisation massive du JavaScript. Un processus coûteux en ressource, mais nécessaire pour garantir une indexation complète.
Comme le précise Zoe Clifford, Google effectue un rendu de toutes les pages web, à condition que ces dernières soient en HTML. Cela exclut donc d’autres formats très présents sur la toile, notamment le format PDF.
Implication de ces déclarations pour les sites
L'amélioration du rendering des sites JavaScript par Google offre de nouvelles opportunités, mais implique également de prendre certaines précautions.
Bien que Google prenne mieux en charge les sites qui utilisent beaucoup de JavaScript, il est important de veiller à assurer la rapidité de chargement des pages pour favoriser leur référencement. Par ailleurs, il reste judicieux de viser la simplicité et d’utiliser JavaScript avec parcimonie pour faciliter la tâche de Google et des utilisateurs. Cela implique notamment de s’assurer que le contenu principal du site soit accessible, même sans JavaScript, pour que les utilisateurs disposant de connexions lentes ou d’appareils anciens ne soient pas bloqués.
Pour vérifier le rendu d’un site, il est possible d’utiliser la fonctionnalité « Examiner le rendu » disponible dans les outils destinés aux webmasters.