Le premier index de Google comprenait 26 millions de pages. Et puis le moteur de recherche avait arrêté la course à la plus grosse taille d'index en 2005 alors que sa base d'urls proposait aux environs de 8 milliards de pages après avoir passé la barre du milliard en 2000. Aujourd'hui, un post sur le blog officiel du moteur estime que le Web détient la bagatelle de mille milliards de documents ! Ou plus précisément, mille milliards d'adresses menant à des documents. Parmi ces urls, on trouvera énormément de "duplicate content" (même contenu à des adresses différentes), beaucoup de pages totalement inutiles, etc. Ce chiffre représente donc le nombre de pages web "connues" de Google avant traitement. Dommage, ce dernier ne donne pas la taille actuelle de son index par la même occasion en disant qu'ils n'ont pas le temps de la calculer... Etrange...
Source de l'image : TTH |
Source(s) :
We knew the web was big... (Google)
Articles connexes sur ce site :
- Taille des index : Google enterre la hache de guerre (28 septembre 2005)
- 20 milliards de documents pour Yahoo! (9 août 2005)
- 11,5 milliards de pages sur le Web (1er juillet 2005)
- 8 milliards de pages pour Google (12 novembre 2004)
- 1 000 000 000 000 d'images sur le Web selon Google ! (10 juillet 2008)
Toutes les pages du réseau Abondance pour la requête taille index...