La Seconde Équation du Budget Crawl - Vidéo SEO Abondance N°166

La Seconde Équation du Budget Crawl – Vidéo SEO Abondance N°166

Olivier Andrieu / 22 Sep 2020 à 07h38

Temps de lecture : 3 minutes

Partagez l'article

On parle souvent de crawl, d'indexation, de page "crawlable" ou "indexable", voire "indexée", mais qu'est-ce qui se cache derrière ces termes ? Et que faut-il faire pour obtenir un "budget crawl" de qualité, facilitant l'exploration de votre site par les moteurs de recherche ? Après avoir analysé la première équation du "budget crawl" la semaine dernière, voici la seconde pour explorer le sujet de façon plus approfondie...

Une nouvelle vidéo sur le thème du budget crawl et l'exploration de votre site par les robots des moteurs ainsi que les pages indexées résultant de cette exploration. La semaine dernière, nous avons analysé, au travers d'un outil de crawl, quelles sont les pages d'un site potentiellement crawlables, puis compté, au travers de la Search Console, le nombre d'URL réellement indexées. Avant d'en tirer les conséquences adéquates sur la bonne santé et l'état de "crawlabilité" de votre source d'informations. C'était la première équation du Budget Crawl.

Mais il est également capital de tenir compte d'une seconde, qui représente l fait que le robot, lors de son crawl, doit absolument se focaliser sur le plu possible de pages indatables pour... les indexer. La bonne gestion des pages ne "noindex", canonicalisées, mais également des 404/410 et des redirections rentre donc en ligne de compte. Explications...

Nous avons essayé de résumer notre vision du sujet dans cette 166e vidéo Abondance :

La Seconde Équation du Budget Crawl - Vidéo N°166 proposée par Olivier Andrieu (Abondance). Source : Abondance

Autres vidéos touchant à ce sujet

Spiders, Robots, Crawlers : comment ça marche ? (6'24", 12 avril 2016).
En SEO, Procédez par étapes : Crawl, Indexation, Optimisation (6'26", 1er octobre 2019).
Pourquoi faut-il désindexer les pages de résultats de son moteur interne ? (5'06", 24 mars 2020).
Comment désindexer rapidement de nombreuses pages sur un site web ? (4'42", 7 avril 2020).
Comment ne pas indexer de nombreuses pages sur un site web (suite) ? (6'01", 14 avril 2020).
X-Robots-Tag, ce méconnu… (6'14", 21 avril 2020).
En-tête HTTP et SEO (5'34", 28 avril 2020).
Search Console et Sitemaps : 3 points à vérifier (5'25", 2 juin 2020).
Pages Crawlables / Indexables : L’Équation du Budget Crawl (6'43", 15 septembre 2020).

Articles complémentaires (listés par ordre chronologique)

Goossips : EMD, Temps de chargement des pages et Budget Crawl (5 décembre 2016).
Goossips : Budget Crawl, HTTPS et Confiance en Google (12 décembre 2016).
Définition du Budget Crawl (12 février 2018).
Budget Crawl : Google nous explique sa vision (12 janvier 2017).
Analyse du comportement de GoogleBot suite à une optimisation de crawl (16 mai 2019).
Goossips : Balises Hn en Doublon, Self-Canonical, Attribut Alt, Contenu Semi-Caché et Featured Snippets, Robots.txt et Budget Crawl (25 juin 2019).

Notre Chaîne YouTube

N'hésitez pas également à visiter la zone "Vidéos SEO" du site et à vous abonner à la chaîne YouTube du site Abondance (ou à son fil RSS) pour découvrir, semaine après semaine, les prochaines vidéos que nous vous proposerons.

4 Commentaires

Thomas W. sur 26 décembre 2020 à 21 h 35 min

Bonjour Olivier, merci pour cette vidéo courte et claire.

Est-ce qu’un bot de moteur de recherche va systématiquement commencer son crawl par la page d’accueil ? Je pose cette question pour 2 raisons : 1- le « sculptage » de PR grâce aux obfuscations, 2-pages orphelines

merci
Réponse
- Olivier Andrieu sur 27 décembre 2020 à 8 h 32 min
  
  Non, clairement pas systématiquement. 🙂
  Réponse
jEAN sur 23 septembre 2020 à 15 h 13 min

Bonjour,

C’est peut être valable sur un blog ou un site institutionnel, mais sur ecommerce, c’est très compliqué à mettre en place pour deux raisons :
1) Les filtres : l’intégralité des dizaines d’urls d’un filtre sont canonicalisés et sont des urls crawlables.
2) La pagination : si google ne parcourt pas les pages suivantes, toutes les fiches produits ne seront pas indexées.

Autant pour la pagination, c’est pas trop grave (quelques dizaines de pages), autant pour les filtres, je ne crois pas qu’il existe de filtre en js.

Avez-vous une solution à ces deux problèmes?
Réponse
- Olivier Andrieu sur 23 septembre 2020 à 15 h 15 min
  
  Pour la pagination, les balises de pagination font le job et oui, il faut absolument les rendre crawlables et potentiellement indexables, pas le choix, par définition !
  Pour les filtres à facettes, la plupart du temps on les rend non crawlables, la solution dépend en général du site et surtout de la plateforme utilisée. C’est du cas par cas.
  Réponse

Laisser un commentaire Annuler la réponse

La Seconde Équation du Budget Crawl – Vidéo SEO Abondance N°166

<img decoding="async" class="wp-image-38311 alignleft" src="https://www.abondance.com/wp-content/uploads/2018/11/logo-videos-150x112.png" alt="" width="50" height="37"> Autres vidéos touchant à ce sujet

<img decoding="async" class="wp-image-38312 alignleft" src="https://www.abondance.com/wp-content/uploads/2018/11/logo-articles.png" alt="" width="48" height="40"> Articles complémentaires (listés par ordre chronologique)

<img decoding="async" class="wp-image-38313 alignleft" src="https://www.abondance.com/wp-content/uploads/2018/11/logo-youtube.png" alt="" width="105" height="23"> Notre Chaîne YouTube

Articles complémentaires :

Google casse les mythes du Crawl Budget : comment favoriser son indexation

Goossips SEO : Budget Crawl et paramètres UTM

Goossips SEO : Crawl budget et liens

Google dévoile une pratique essentielle pour le crawl budget… ne passez pas à côté !

Goossips SEO : Googlebot, budget crawl, paramètres URL

La fin du limiteur de vitesse de crawl Google !

Autres vidéos touchant à ce sujet

Articles complémentaires (listés par ordre chronologique)

Notre Chaîne YouTube