Combien d'étapes existe-t-il pour une page web avant d'apparaître dans les résultats de recherche d'un moteur ? Cette infographie décrit en détail les système de crawl et d'indexation de Google. Et ce n'est pas rien...
Notre infographie du vendredi est proposée aujourd'hui par Jan-Peter Ruhso qui a rassemblé dans le schéma ci-dessous tout le processus de crawl (Googlebot) et d'indexation de pages web par Google. Certes, ce n'est pas de la fine poésie et le côté « fun » de ce travail ne saute pas aux yeux, pourtant c'est un vrai beau travail de synthèse de la façon donc fonctionnent les algorithmes de Google « avant classement » depuis Caffeine en 2010.
Bravo donc pour ce beau schéma dans lequel nous pouvons suivre toutes les étapes (nombreuses) qu'une page web devra vivre pour se retrouver (si tout va bien) dans l'index du moteur de recherche : détection du "noindex", des codes HTTP, du contenu dupliqué, du code HTML, rendition, Soft 404, balises de données structurées, périodicité des visites, etc. Avec à la fin, le Graal de la SERP ! 🙂
Vous pouvez également cliquer sur l'infographie pour en obtenir une version agrandie :
Infographie : Le processus de crawl et d'indexation de Google. Source : Twitter.