Voici quelques chiffres sur le nouvel AltaVista, sur lequel on commence à obtenir des infos complémentaires : son index proposerait 275 millions de pages (90% des sites Web, selon le portail) et 25 millions d'"objets multimédia" (image, vidéos, sons). En fait, AltaVista ferait un crawl sur 350 millions de pages actuellement pour n'en garder que 275 (stratégie identique à celle d'Excite qui effectue son crawl sur un nombre plus grand de pages), éliminant au passage pages identiques et pages satellites pour un même site.
L'annuaire d'AltaVista est actuellement fourni par l'Open Directory (un million de sites, répartis dans près de 170 000 catégories différentes par plus de 17 000 internautes volontaires dans 229 pays et 44 langues différentes) mais sera très bientôt complété par les données en provenance de l'autre annuaire Looksmart (un million de sites, 180 éditeurs environ).
Comme pour la plupart des outils de recherche, les résultats d'AltaVista risquent donc de plus en plus, à l'avenir, de provenir d'abord d'annuaires dans les premières pages et, en second lieu, de moteurs. Le terrain est en tout cas propice, notamment sur AltaVista, à ce fait, même si ce n'est pas encore le cas pour l'instant. L'utilisation de résultats émanant d'annuaires en premier lieu rendra totalement caduque (avec de plus les fonctions de clustering sur les moteurs, voir brève de lundi) toute tentative de positionnement fin de site Web sur un outil de recherche dans un proche avenir. Quant à une quelconque garantie de positionnement, n'en parlons pas... Rappelons que l'Open Directory est déjà utilisé par AOL, Netscape, Lycos, HotBot et d'autres.
Open Directory :
http://www.dmoz.org/
Looksmart :
http://www.looksmart.com/
Une explication du nouveau logo d'AltaVista :
http://www.altavista.com/av3/promo/20_ads_logo.html