Vous utilisez souvent Google pour vérifier la version en cache d'une page web et vous tombez quasi systématiquement sur une page d'erreur de type 404 ? Voici une astuce pour corriger ce bug du moteur de recherche...

Vous faites peut-être partie des personnes qui utilisent la syntaxe "cache:" (ou qui utilisent l'option "En cache" du menu déroulant à droite de l'URL dans les résultats de recherche de Google) pour regarder à quoi correspond la version d'une page web actuellement disponible dans l'index du moteur de recherche (notamment pour vérifier si cette version correspond bien à celle en ligne à un temps T).

Or, depuis quelques mois, le moteur avait un bug (connu, répertorié en interne mais toujours pas corrigé) qui renvoyait un code 404 sur ce type d'interrogation, avec la page suivante :

Envoi d'un code 404 sur une demande de version en cache d'une page web. Source : Abondance

Ce bug était même devenu systématique avec les pages versées dans l'index Mobile First, à tel point que certaines personnes l'utilisaient (à tort !) pour savoir si un site était versé dans cet index. A tort, car certaines URL renvoyaient ce code 404 alors qu'elles n'avaient pas encore franchi les portes du nouvel index Google. Le bug n'était en rien exclusif de l'IMF. Bref, c'est un peu la bouteille à l'encre depuis pas mal de temps chez Google à ce niveau.

Du coup John Mueller a partagé sur Twitter hier une astuce qui permet de résoudre, a priori dans de nombreux cas (mais pas tous ?) ce problème : il s'agit de remplacer un élément de l'URL obtenue (celle de la page qui affiche le code 404) par la mention "x.xyz" (ou n'importe quel autre domaine, d'ailleurs).

Exemple : vous demandez la version en cache de l'URL https://www.definitions-seo.com/ et vous obtenez le code 404 sur l'URL suivante (résultante de l'utilisation du menu "En cache" de la SERP) :
https://webcache.googleusercontent.com/search?q=cache:--ij1IDLWAEJ:https://www.definitions-seo.com/
Dans cette URL, vous allez supprimer l'élément "https://www.definitions-seo.com/", à la fin, pour le remplacer par "x.xyz" afin d'obtenir l'URL suivante :
https://webcache.googleusercontent.com/search?q=cache:--ij1IDLWAEJ:x.xyz
Et cette URL va fonctionner : elle affichera la version en cache de la page en question...

Cela marchera également avec une page interne. Ainsi pour l'URL https://www.definitions-seo.com/definition-de-noogler/ qui va donner le code 404 ici :
https://webcache.googleusercontent.com/search?q=cache:72sTj1hLYJ8J:https://www.definitions-seo.com/definition-de-noogler/
Mais fonctionnera avec le nouveau paramètre :
https://webcache.googleusercontent.com/search?q=cache:72sTj1hLYJ8J:x.xyz

Est-ce que cette astuce fonctionne dans tous les cas ? Peut-être pas. A vous de faire vos propres tests. Par exemple, nous n'avons pas trouvé comment faire sur l'URL résulttante de la syntaxe "cache:". Il semblerait que cela ne fonctionne qu'avec l'URL résultante de l'utilisation du menu déroulant "En cache" de la SERP. Mais c'est déjà bien 🙂

Le tweet de John Mueller sur l'option permettant d'afficher le cache Google. Source : Twitter