Chaque semaine, nous vous proposons une FAQ sur un sujet SEO spécifique. Après le SEO, l'Index Mobile First, la recherche vocale et les Sitemaps XML, voici tout ce qu'il faut savoir, sous forme de FAQ, sur le fameux PageRank de Google...

   

FAQ sur le pageRank

   

🏄 Qu'est-ce que le PageRank ?
Le PageRank est un algorithme créé par Google qui donne une note de popularité à une page web en analysant la quantité et la qualité des liens (backlinks) qui pointent vers elle. Il s'agit de l'un des critères de l'algorithme général du moteur.

🏄 D'où vient son nom ?
De Larry Page, un des deux cofondateurs de Google (avec Sergueï Brin), qui a popularisé cet algorithme à travers le document fondateur du moteur de recherche, intitulé « The Anatomy of a Large-Scale Hypertextual Web Search Engine au début des années 2000.

🏄 Le PageRank existe-t-il encore ?
Bien sûr, il fait encore partie de l'algorithme de Google, même si son importance a certainement diminué au fil des ans, car de nombreux autres critères de pertinence sont venus s'ajouter au système d'analyse, d'évaluation et de classement de pages du moteur. Mais il reste encore aujourd'hui au centre du fonctionnement du moteur.

🏄 Comment fonctionne le PageRank ?
Pour schématiser, une page obtiendra un PageRank (ou PR) d'autant plus fort qu'il reçoit des liens émanant de pages elle-mêmes populaires sur d'autres sites. On appelle « link juice » ou « jus de lien » le transfert de popularité effectué au travers du lien. Par exemple, et c'est encore là une approximation, une page A qui aurait un PR de 100 et 2 liens sortants vers B et C, enverra à chacune de ces pages un « jus » de 50. S'il y a 3 liens sortants, chaque page (B, C, D) recevra 33. Etc. Certains critères et coefficients tiennent compte d'autres phénomènes, comme celui du surfeur aléatoire (voir ci-dessous). Des simulateurs de PR (selon la formule de départ) existent, comme ici ou .

🏄 Le PageRank a-t-il évolué ?
Oui, certainement, notamment en 2003 après le rachat de la société Kaltix par Google, qui a permis d'injecter une dose de thématisation à l'algorithme. Mais depuis sa création, Google n'a plus jamais communiqué sur les évolutions du PageRank pour protéger l'algorithme contre le spam.

🏄 Peut-on afficher le PageRank d'une page sur un navigateur ?
On pouvait le faire jusqu'en 2016 grâce au TBPR (ToolBar PageRank, qui n'était déjà à cette époque plus mis à jour depuis 2013), une petite barre verte insérée dans le navigateur et qui donnait une note approximative, entre 0 et 10, du PageRank de la page affichée. Cet indicateur est aujourd'hui obsolète et abandonné. Il n'est désormais plus possible d'avoir une vision, et même une estimation, du PageRank d'une page.

🏄 Un indicateur remplace-t-il le TBPR aujourd'hui ?
Il en existe plusieurs comme le Citation Flow (et le Trust Flow) de Majestic, le Domain Authority de Moz, le Domain Rating de Ahrefs et bien d'autres. Mais aucun ne représente la même chose que le « vrai » PageRank de Google, dont personne (en dehors du moteur) ne connait la véritable formule de calcul.

🏄 Surfeur aléatoire et raisonnable, Kezaco ?
La formule originelle du PageRank indiquait que cet algorithme avait pour but de modéliser la navigation d’un internaute virtuel (appelé « surfeur aléatoire ») pour quantifier l’importance des pages web les unes par rapport aux autres. Le surfeur aléatoire est donc un internaute qui parcourt le web en cliquant aléatoirement sur les liens sortants de la page sur laquelle il est, à un moment donné. Parfois, le surfeur aléatoire peut décider de changer totalement de voisinage, ce qui est implicitement modélisé par une probabilité de continuer, ou non, à suivre les liens. Lorsqu’il décide de ne plus les suivre, il recommence son parcours à partir d’une page tirée au sort aléatoirement sur le Web. On parle alors de téléportation. Sur cette base, la notion de « surfeur raisonnable », apparue à partir de 2012, prend en compte le fait que, dans une page web, tous les liens ne sont pas semblables (emplacement, texte ou image, ancre, interne/externe, sémantique, etc.). Le raisonnable est donc une évolution plus sophistiquée de l'aléatoire.

Cette FAQ a notamment été écrite grâce aux différents articles de Sylvain Peyronnet et Daniel Roch pour le site Réacteur (liste non exhaustive) :

Modélisation du PageRank. Source : Wikipedia