Lorsqu'une URL est en 404, le site web affiche dans le navigateur une page d'erreur contenant du texte, des images, des liens, etc. Mais cette page est-elle lue et analysée par Google et les moteurs de recherche ? Réponse...
Nous continuons notre série de vidéos sur les codes 404 avec cette troisième mouture (qui n'est pas la dernière), qui répond à une question qui revient souvent lorsqu'on aborde ce sujet des "page not found" : est-ce que les moteurs de recherche lisent les pages 404 et donc leur code HTML, leur texte, leurs images ? Est-ce qu'ils suivent leurs liens, etc. Bref, est-il nécessaire de penser la page 404 en termes de SEO ou uniquement pour l'internaute ? Voici la réponse...
Google lit-il les pages 404 ? Vidéo proposée par Olivier Andrieu (Abondance). Source : Abondance |
Voici quelques vidéos déjà publiées sur un sujet connexe :
- Spiders, Robots, Crawlers : comment ça marche ? (6'24", 12 avril 2016).
- Code 404 ou 410 : lequel choisir ? (4'44", 10 avril 2018).
- Google pénalise-t-il les erreurs 404 ? (4'26", 24 avril 2018).
Voici également quelques articles complémentaires (listés par ordre chronologique) pour approfondir le sujet :
- Un brevet sur les pages 404 contextuelles utile au référencement ? (5 février 2008).
- Corrigez vos 404 et gagnez des backlinks ! (10 février 2015).
- 404 et pénalités, backlinks sur des Soft 404, Pipes dans les URL : quelques infos SEO sur l'algorithme Google (12 août 2015).
- Erreur 404 et SEO : ce qu'il faut savoir... (15 janvier 2016).
- Goossips : 404, Nofollow, Sites Adultes et Délais de Crawl (26 mars 2018).
N'hésitez pas également à visiter la zone "Vidéos SEO" du site et à vous abonner à la chaîne YouTube du site Abondance (ou à son fil RSS) pour découvrir, semaine après semaine, les prochaines vidéos que nous vous proposerons.
@ Fabien Branchut : dans ce cas, on verra dans les logs sir google a crawlé les pages de test, et également dans Analytics si elles ont reçu des visites…
Comment être certains (scientifiquement) que Googlebot ne « lit » pas le code HTML des erreurs 404 ?
Analyse de logs 😉
Merci Olivier pour votre réponse, mais je ne vois pas bien comment, puisque quand le serveur transmets sa réponse au « client » (ici le robot de Google), il envoi l’en-tête HTTP (dont le code 404) + code HTML en même temps.
Il y a mille façons de tester (enfin, peut-être pas autant 🙂 ) : par exemple des liens dans la page 404 vers des pages de test et on regarde dans les logs si Googlebot suit ces liens et vient crawler les pages. C’est une façon…
Oui effectivement, c’en est une merci 🙂 mais peu précise puisque Google peut quand même très bien décider de « lire » le code HTML (puisqu’il détient ce code au moment où il arrive sur la page), d’en apprécier la thématique (entre autre), sans obligatoirement suivre les liens.