John Mueller a indiqué dans un hangout que Google avait amélioré son système de calcul du nombre de pages indexées pour un site web, donnée affichée dans la Search Console (Webmaster Tools). Cela suscite quelques interrogations de notre part...
Petit pataquès de communication (encore un ?) chez Google actuellement au sujet du nombre de pages indexées affiché pour site web dans la Search Console (Webmaster Tools) dans la zone "Index Google > Etat de l'indexation" dont voici un exemple :
Source de l'image : Google |
Il y a quelques semaines (entre le 16 et le 23 août, comme on le voit bien sur le graphique ci-dessus au niveau de la flèche rouge), ce nombre de pages indexées avait chuté de façon anormale pour se restabiliser quelques jours plus tard. John Mueller, dans un hangout (à partir de 5'30", voir ci-dessous) explique, de façon un peu floue, à Barry Schwartz qu'il s'agissait en fait d'une coïncidence entre un bug chez eux et le moment où ils ont décidé d'améliorer ce comptage de pages afin qu'il soit plus précis.
4 remarques sur le nombre de pages indexées
Ce fait amène donc 4 remarques :
- La nouvelle est surtout que Google a modifié/amélioré son système de calcul du nombre de pages indexées pour un site web, ce qui est une bonne chose.
- Aucun rappel ou mention n'est fait (sous la forme d'un trait vertical en règle générale dans les Webmaster Tools, lorsque cela est fait) de cette date de modification du système de comptage sur les graphiques, ce qui est dommage. Attention donc : à partir de fin août, il peut y avoir un décalage au niveau des stats sur la courbe fournie. On aurait apprécié un peu plus de communication de la part de Google à ce sujet.
- Il est étonnant de voir que Google ait du mal à effectuer ce comptage du nombre de pages indexées, ce qui semble pourtant ultra-simple (même dans un index aussi énorme que le sien). Que la syntaxe de recherche "site:" soit approximative, on peut le comprendre car il faut répondre très rapidement à une requête en ligne. Mais dans les Webmaster Tools, Google a tout le temps d'effectuer ces calculs. Il est étonnant qu'il en soit encore aujourd'hui à améliorer ce système...
- Rappelons qu'il serait VRAIMENT très utile de pouvoir télécharger les URL des pages indexées. Cela permettrait de vérifier que toutes les pages importantes sont présentes, mais également de nettoyer l'index de Google de pages de faible qualité. Tout le monde aurait à y gagner en ne présentant au moteur que les pages réellement intéressantes. C'est, à notre avis, le plus grand manque des Webmaster Tools à l'heure actuelle !
Source de l'image : YouTube |
Je n’ai globalement pas trop constaté de baisse sauf pour un site qui comporte environ 9000 pages. Depuis le 16 août, la courbe stagne avec quand même une baisse de -25%.
Salut à tous,
J’ai aussi connu une baisse -40% mais aucune remonté. Cependant au vu de l’état de l’indexation que je fais de façon hebdomadaire à l’aide de la recherche site: , seul les pages de faibles qualités ont été impactés (j’ai même eu une augmentation de l’indexation des mes fiches et listes de produits). J’en conclus que le comptage est plus précis en effet.
Pour ma part l’état d’indexation a bien chuté le 16 Août pour atteindre -50% le 23 août et n’est jamais remonté.
Effectivement Google aurait tout à y gagner en nous donnant la liste des urls indexées on pourrait ainsi l’aider à nettoyer et au final lui alléger un taux de crawl énorme.
Google si tu nous lis 🙂
@ Luc, non, je ne pense pas que ça existe hélas…
@olivier : oui un dossier précis, mais par exemple si je sais que je dois supprimer tous les articles avant tel ou tel date (parce que par exemple ce sont des articles trop spammy, ou mauvais…), imaginons qu’il y ai 150 articles de genre, le faire url par url via l’outil de suppression d’url, c’est un peu la loose… en tous cas je n’ai pas trouvé d’astuce simple et efficace (je suis preneur si il en existe 😉 )
@ Luc : on peut désindexer un directory complet mais effectivement, une procédure de désindexation page par page, un peu semblable à celle qui existe pour le désaveu de liens serait sympa…
Si « télécharger les URL des pages indexées » serait en effet un gros plus dans search console, pouvoir faire une demande de désindexation de plusieurs url en seul fichier importé (ou autres techniques) serait aussi la bienvenue !
J’ai souvent le cas lors de refonte de site web, de vouloir supprimer des articles de mauvaises qualité (par exemple), je suis surpris qu’on ne puisse pas le faire simplement… Sauf erreur de ma part ça n’est pas possible !?!