Le lancement du site gratuit Outiref la semaine dernière et l'analyse de ses résultats quelque jours plus tard nous ont montré un bug assez étonnant sur plusieurs sites : de nombreuses pages web s'affichant bien dans un navigateur renvoient pourtant des codes de type 403, 404 ou 500 (au lieu de 200). Autant dire que Google ne sera pas ravi d'obtenir ces codes lorsqu'il explorera votre site et que votre SEO devrait en être fortement pénalisé. A tester et corriger sans attendre !...
Il y a quelques jours, nous avons lancé en version bêta le site Outiref, un outil gratuit qui permet d'effectuer un audit de page web : balises Title, meta "description", structure en balises Hn, URL, analyse statistique et sémantique du contenu textuel, balises diverses, liens sortants, popularité, données techniques, etc.
Pendant cette phase de lancement "bêta", qui durera tout l'été, nous regardons chaque jour les audits effectués et les éventuelles erreurs (et bugs) constatés, afin d'améliorer l'outil au fil de l'eau. Au départ, nous avons pris la décision (a priori légitime) de n'effectuer un audit de page que si le code HTTP renvoyé était 200, c'est-à-dire un succès de la requête demandée (la liste des codes HTTP est disponible ici. Cela nous semblait normal : si une page s'affiche bien dans un navigateur, son code HTTP doit être 200. Quoi de plus naturel ? Eh bien, finalement, on s'est aperçu que non : de nombreuses pages web s'affichent comme si de rien n'était dans le navigateur des internautes mais renvoient des codes différents de 200, comme : 403, 404, 500, 503, etc. Et comme cette donnée n'est pas obligatoirement visible au premier abord, de nombreux webmasters ne s'en rendent pas compte. En revanche, Google, lorsqu'il vient crawler (explorer) ces pages, ne doit pas être ravi d'obtenir un tel code, c'est le moins que l'on puisse dire !!!
Notre conseil donc :
1. Passez vos pages principales à la "moulinette" d'Outiref.
2. Si l'audit se lance, pas de problèmes, le code doit être 200. Mais vérifiez-le quand même dans l'onglet "Données techniques" comme indiqué dans l'illustration ci-dessous (on trouve également parfois des redirections 301 ou 302 à ce niveau).
Indication dans Outiref du code HTTP renvoyé... Source de l'image : Abondance |
3. Si vous obtenez un message d'erreur ("L'URL XXX n'est pas accessible. Raison : la page renvoie un code YYY", voir illustration ci-dessous)) et que l'URL que vous avez saisie est bien valide lorsque vous la tapez dans la barre d'adresse d'un navigateur, contactez votre administrateur système ou la personne qui s'occupe techniquement de votre site car cela n'est pas normal. Ce point est à vérifier et à corriger absolument !!
Exemple de page web s'affichant dans un navigateur mais renvoyant pourtant un code 404 au lieu de 200... Source de l'image : Abondance |
Bizarrement, à la lecture des résultats des différents audits lancés sur l'outil (plus de 4 000 en quelques jours, ce qui donne une bonne base d'analyse), ce problème se rencontre beaucoup plus souvent qu'on ne pouvait l'imaginer au départ. A vous de vérifier donc que votre site renvoie les bons codes HTTP aux navigateurs et... aux moteurs, sous peine de problèmes en termes de référencement naturel ! Cela ne prend que quelques minutes et c'est gratuit. Alors, pourquoi s'en passer ? 🙂
Je suis en train de tester l’outil d’analyse sémantique 1.fr et je parviens, grâce à cet outil, à faire progresser significativement mes résultats de recherche sur Google. Ma question: existe-t-il un outil équivalent à 1.fr pour les sites web en anglais? Merci !
.. désolé l’erreur de frappe … « n’est donc pas traité ».
Je confirme que pour le moteur Premsgo, le traitement d’une page ne se fait QUE si celle-ci renvoie un code http 200 ok ou 3xx . Les code 4xx et 5xx ne traitent pas le contenu.
Les codes 3xx cherchent une redirection dans l’entete http uniquement (pour le moment).
Le code 304 indique que le contenu n’a pas changé depuis le dernier crawl (if-modified-since) et n’ai don pas traité (mais la date mise à jour).
Mais du coup, comment l’administrateur règle le problème du code HTTP ?
Pour contrôler les entêtes de redirection rapidement, j’utilise une extension sur Chrome qui s’appelle « Redirect Path ». Plutôt utilse pour détecter les mauvaises redirections !! 🙂
Disponible ici : https://chrome.google.com/webstore/detail/redirect-path/aomidfkchockcldhbkggjokdkkebmdll?hl=en
Ah je l’avais pas vu celui-ci…Bon, tu confirmes ce que je pense quand je vois que mes données analytics (hausse) sont en inversion avec ce fameux Alexa. A laisser de coté, donc 🙂
Salut Olivier,
Merci pour ce rappel…on se focalise souvent sur l’acquisition de liens et le contenu, mais à quoi bon si les codes renvoyés ne son pas ok…L’outil est vraiment simple et rapide à utiliser.
Bonnes vacances
Yvan,
NB: une suggestion (possible ?) d’article: j’ai constaté que nous sommes de nombreux référenceurs à s’interroger sur l’alexa rank. Pourrais-tu nous éclairer sur ce sujet ?
Alexa Rank ? Est-ce que ça mérite vraiment un article ? En fait, j’en parlais déjà en 2007 🙂
https://www.abondance.com/actualites/20070613-8522-alexa-un-coup-de-barre.html