Vous utilisez souvent Google pour vérifier la version en cache d'une page web et vous tombez quasi systématiquement sur une page d'erreur de type 404 ? Voici une astuce pour corriger ce bug du moteur de recherche...
Vous faites peut-être partie des personnes qui utilisent la syntaxe "cache:" (ou qui utilisent l'option "En cache" du menu déroulant à droite de l'URL dans les résultats de recherche de Google) pour regarder à quoi correspond la version d'une page web actuellement disponible dans l'index du moteur de recherche (notamment pour vérifier si cette version correspond bien à celle en ligne à un temps T).
Or, depuis quelques mois, le moteur avait un bug (connu, répertorié en interne mais toujours pas corrigé) qui renvoyait un code 404 sur ce type d'interrogation, avec la page suivante :
Ce bug était même devenu systématique avec les pages versées dans l'index Mobile First, à tel point que certaines personnes l'utilisaient (à tort !) pour savoir si un site était versé dans cet index. A tort, car certaines URL renvoyaient ce code 404 alors qu'elles n'avaient pas encore franchi les portes du nouvel index Google. Le bug n'était en rien exclusif de l'IMF. Bref, c'est un peu la bouteille à l'encre depuis pas mal de temps chez Google à ce niveau.
Du coup John Mueller a partagé sur Twitter hier une astuce qui permet de résoudre, a priori dans de nombreux cas (mais pas tous ?) ce problème : il s'agit de remplacer un élément de l'URL obtenue (celle de la page qui affiche le code 404) par la mention "x.xyz" (ou n'importe quel autre domaine, d'ailleurs).
Exemple : vous demandez la version en cache de l'URL https://www.definitions-seo.com/ et vous obtenez le code 404 sur l'URL suivante (résultante de l'utilisation du menu "En cache" de la SERP) :
https://webcache.googleusercontent.com/search?q=cache:--ij1IDLWAEJ:https://www.definitions-seo.com/
Dans cette URL, vous allez supprimer l'élément "https://www.definitions-seo.com/", à la fin, pour le remplacer par "x.xyz" afin d'obtenir l'URL suivante :
https://webcache.googleusercontent.com/search?q=cache:--ij1IDLWAEJ:x.xyz
Et cette URL va fonctionner : elle affichera la version en cache de la page en question...
Cela marchera également avec une page interne. Ainsi pour l'URL https://www.definitions-seo.com/definition-de-noogler/ qui va donner le code 404 ici :
https://webcache.googleusercontent.com/search?q=cache:72sTj1hLYJ8J:https://www.definitions-seo.com/definition-de-noogler/
Mais fonctionnera avec le nouveau paramètre :
https://webcache.googleusercontent.com/search?q=cache:72sTj1hLYJ8J:x.xyz
Est-ce que cette astuce fonctionne dans tous les cas ? Peut-être pas. A vous de faire vos propres tests. Par exemple, nous n'avons pas trouvé comment faire sur l'URL résulttante de la syntaxe "cache:". Il semblerait que cela ne fonctionne qu'avec l'URL résultante de l'utilisation du menu déroulant "En cache" de la SERP. Mais c'est déjà bien 🙂
Someone on Twitter noticed you can make it work if you change the cached page URL after clicking in search. I don't know if that always works, but it's a cool hack. https://t.co/NXjxmC8tdP
-> https://t.co/8sFmkyVAJq— 🍌 John 🍌 (@JohnMu) 8 octobre 2018
Merci beaucoup pour toutes ces informations claires et utiles !
Je dirais même que vous pouvez ajouter n’importe quelle lettre, n’importe où dans l’URL de la page que vous souhaitez atteindre et ça fonctionnera 😉
Merci pour l’astuce !!! 🙂
Mais attention, on dirait qu’il y a une coquille dans le texte.
Vous écrivez
« pour le remplacer par « x:xyz » afin d’obtenir l’URL suivante : »
alors que cela devrait être
« x.xyz »
non ?
Bien sûr ! C’est corrigé, merci !
Merci pour l’astuce!
Par contre, cela ne fonctionne bien entendu pas en passant via une recherche du genre :
cache:url
Ce que, personnellement, j’ai l’habitude de faire.
Mais bon visiblement il suffit de saisir l’url dans google (ou site:url) et ensuite de cliquer sur le lien du cache pour que l’astuce soit valide
Ça fait DES MOIS que j’ai ce souci et impossible de le résoudre. J’avais raté l’info comme quoi c’était UN BUG connu, je pensais que c’était quelque chose sur mon site qui empêchait la mise en cache (peut-être une librairie Javascript) et j’avais peur que ça n’affecte le ranking. Je me suis vraiment fait des cheveux blancs avec cette histoire…
Cela ne fonctionne pas pour mon site ! 🙂
Merci pour l’article.
Sait-on à quoi correspond x.xyz ?
Si je remplace « X » par « Y » ça fonctionne aussi. Est-ce que xyz correspond à une extension de domaine vers un autre serveur ?
En tout cas l’astuce fonctionne bien pour les sites que j’ai pu tester 🙂
Vous pouvez mettre n’importe quel nom de domaine à la place de x.xyz (merci à Paul S. pour le tuyau 🙂 ).