La requête « site: » sur Google permet de lister les pages que Google a indexé pour un site web donné. Mais dans quel ordre ces résultats sont-ils listés ? Quels sont les critères de pertinence utilisés ?
La requête "site:" est très utile sur Google car elle permet de lister (de façon certes très approximative) un ensemble de pages web indexées par le moteur de recherche pour un site donné. Mais une question revient souvent (et sur laquelle, à notre connaissance, Google n'a jamais communiqué de façon officielle) : comment ces résultats sont-ils classés dans la SERP ? Quels liens sont affichés en premier et lesquels sont listés en dernier ? Bien sûr les enjeux de visibilité sont quasi nuls (le but d'un référenceur n'est pas de viser la première place sur une requête site: 🙂 ), ce qui veut certainement dire que l'algorithme de classement utilisé est assez simple, mais voici notre vision et notre explication, basée sur notre expérience :
Dans quel ordre Google affiche-t-il ses résultats sur une requête « site: » ? Vidéo proposée par Olivier Andrieu (Abondance). Source : Abondance |
Voici quelques vidéos déjà publiées sur un sujet connexe :
- La syntaxe d'interrogation avancée de Google (7'22", 27 septembre 2016).
- Comment obtenir la liste des URL indexées par Google en HTTP et HTTPS ? (3'50", 29 août 2017).
- SERP sans lien bleu : Google a-t-il ouvert la boîte de Pandore ? (9'08", 20 mars 2018).
- Combien de liens naturels dans une SERP Google ? (6'06", 13 juin 2017).
- SERP et SEO (10'36", 15 mars 2016).
Voici également quelques articles complémentaires (listés par ordre chronologique) pour approfondir le sujet :
- La syntaxe site: sur Google, pas très exacte ? c'est pas faux... (6 octobre 2010).
- Google : bug sur la syntaxe "site:" (24 mai 2013).
- Goossips : Requête Site:, URL et Répertoires (6 février 2017).
- Sitemaps et nombre d'URL indexées - (Questions/réponses avec Google #7) (21 mai 20105).
- Pourquoi ne peut-on pas télécharger la liste des URL d'un site indexées par Google ? (4 mai 2016).
N'hésitez pas également à visiter la zone "Vidéos SEO" du site et à vous abonner à la chaîne YouTube du site Abondance (ou à son fil RSS) pour découvrir, semaine après semaine, les prochaines vidéos que nous vous proposerons.
Bonjour,
Si les résultats d’une requête « site: » sont très différents du type de résultats habituel que vous décrivez dans la vidéo, cela veut-il dire qu’il y a un problème sur le site ?
J’ai en effet un site pour lequel, les résultats avec la requête « site: » ont récemment changés.
Les pages stratégiques les plus importantes du site ne ressorte plus du tout dans les premières SERP et au contraire, des pages de moindre intérêt ressortent très bien.
Ainsi, j’ai des dizaines de pages « réalisations » ou de pages « magasins » (adresse, horaires…) qui arrivent en premier (pourtant très faible pagerank + URL longues) alors que les pages catégories (très bien maillées) ne sont visibles qu’à partir des pages 10-15…
Merci,
Bonne journée,
Julien
Bjr. J’ai du mal à imaginer que quelqu’un, chez Google, ait imaginé comme critère de classement sur une requête, quelle qu’elle soit, le fait qu’il y ait des underscores dans les URL. Et plus encore que ce critère ait été accepté par les autres ? Non ?
Bonjour Olivier,
Je t’invite à lire cet article que j’avais rédigé sur le sujet il y a quelques années maintenant et qui va plus loin dans la réflexion : http://www.anthony-degrange.fr/test-seo-analyse-classement-commande-google-site/. Je ne pense pas qu’il y ait de critère de PageRank. C’est simplement formel, le 1er critère étant la présence ou non de la meta description. Suivent la longueur des URLs comme 2è critère d’importance. Ensuite, les pages avec underscore semblent a priori ressortir en priorité sur cette commande site: par rapport aux pages ayant un tiret dans l’URL.
Pour info, le test avait été fait sur un site sans aucun historique quel qu’il soit, d’où le fait que pour moi le PR n’influe en rien dans l’histoire.
Plus d’infos à ce sujet dans l’article !
Je vous cite : « […] les pages qui ont le plus fort PR sont celles qui seront affichés en premier, c’est pour ça d’ailleurs qu’on a souvent la page d’accueil qui est affichée en premier […] » Vous ne dites pas que vous le connaissez mais vous basez votre raisonnement autour.
Je suis d’accord que personne ne connait le PR de ses pages mais nous savons sur quelle page nous faisons pointer nos liens, donc où nous envoyons du jus.
Enfin bon, nous sommes ici dans de la supposition de logique de classement, j’essayais juste de compléter avec mon avis sur le nombre de visites/popularité des pages.
Mais je n’ai jamais dit que je connaissais le PR de mes pages ? Comment le pourrais-je d’ailleurs ? D’où ma question.
Bonne question! En tout cas je sais ou j’envoie mes liens.. Du coup j’ai envie de vous poser la même question. Comment connaissez-vous le PR de vos pages ?
Comment connaissez-vous le PR de vos pages ??
Bonjour,
Je pensais la même chose que vous au début mais après analyse sur plusieurs sites je ne pense pas que le PR soit le plus gros critère. Par contre je suis d’accord avec la longueur de l’URL.
En effet sur plusieurs de mes sites je constates que c’est souvent les pages les plus visités ce qui rejoint quand vous dites « Les plus populaires ». Ma page qui a le plus for PR après ma page d’accueil n’est que 4ème. Par contre la page qui a le plus de visite est la 2ème.
Voila pour mon avis sur la question mais en tout cas merci pour vos vidéos et votre travail.
Bien cordialement
Effectivement, le PageRank semble être le critère principal de classement.
En ce qui concerne la longueur des URL, ils s’agit peut-être d’une corrélation avec le PR, car les pages à fort PR sont souvent celles de haut niveau dans l’arborescence et donc souvent courtes. A contrario, les pages profondes, de longues traines, avec moins de PR sont souvent des pages avec des titres + longs et rangées dans des répertoires.