Voila a mis en ligne une version Beta de son nouveau moteur de recherche. Ce nouveau moteur (nom de code interne chez France Télécom : "KE") est prévu pour contenir jusqu'à 1,5 milliards d'URLs, voire plus. Il devrait "démarrer" d'ici l'été avec environ 300 millions d'adresses dans son index et 11 millions de pages en langue française. A la fin de l'année 2000, ce chiffre pourrait atteindre 400 à 500 millions. Le but n'est pas obligatoirement de recenser TOUTES les pages du Web mais de proposer un index solide souvent mis à jour. L'objectif de Voila en ce sens est ambitieux : indexation sous 24 heures des sites soumis au moteur, mise en place d'un algorithme de réindexation en fonction de la fréquence de mise à jour des pages (en d'autres termes, une page qui est rarement mise à jour n'est pas indexée souvent, une page d'actualité quotidienne sera "crawlée" tous les jours).

Dans le mode de recherche par défaut du nouveau moteur, les réponses qui correspondent exactement à l'expression demandée apparaissent maintenant en premier. Si vous tapez plusieurs mots, ce sont les documents qui comportent tous ces mots qui vont également apparaître en premier. Viennent ensuite ceux qui contiennent une partie seulement des mots. Une option "classer par popularité" permet de tenir compte de l'indice de popularité (le nombre de liens présent sur le Web vers les sites présentés dans les résultats de la requête, voir en fin d'article), comme sur la plupart des moteurs majeurs actuels. Le système analyse donc les liens croisés des réponses de la liste entre elles : plus un site est référencé par les autres, meilleure sera sa position dans la liste-réponse. Le nouveau système affiche également, en gras lorsqu'ils sont affichés, les mots que vous avez recherchés pour chacune des urls retrouvées.

Un nouveau procédé permet également d'accélerer l'affichage des 10.000 recherches les plus fréquentes. L'assistant de recherche avancée bénéficie d'une ergonomie simplifiée, et permet désormais d'effectuer des recherches dans des parties spécifiques de pages web : vous pouvez, par exemple, faire porter votre recherche sur le titre, ou les mots-clés des pages html . Une nouvelle aide vous indique enfin la syntaxe à employer, et décrit tous les paramètres à utiliser ainsi que ceux qui sont à venir prochainement. Les nouveaux opérateurs de recherche (outre les "classiques +, - et guillemets) sont les suivants :

text: Le ou les mots spécifiés doivent être contenus dans n'importe quel endroit de la page hormis les tags TITLE, A, IMAGE, META KEYWORD et META DESCRIPTION. Exemple : text:bourse.

title: Le ou les mots spécifiés doivent être contenus dans le titre (balise TITLE). Exemple : title:publicité

anchor: Le ou les mots spécifiés doivent être contenus dans le texte d'un lien html. Exemple : anchor:voila

alt: Le ou les mots spécifiés doivent être contenus dans le texte associé à la propriété ALT d'une image. Exemple : alt:eclipse

keywords: Le ou les mots spécifiés doivent faire partie des mot-clés (META KEYWORDS). Exemple : keywords:commerce

description: Le ou les mots spécifiés doivent être contenus dans la description du document (META DESCRIPTION). Exemple : description:mode +paris

url: Le ou les mots spécifiés doivent faire partie de l'URL de la page. Exemple : url:voila

domain: La page doit faire partie du domaine spécifié. Exemple : domain:voila.fr

link: La page doit contenir un lien vers l'URL spécifiée. Exemple : link:www.voila.fr

feature: Permet de rechercher des pages contenant un objet. Les valeurs sont les suivantes : image, sound, video et interactif (pour les fichiers javascript, java, flash). On doit combiner ce filtre avec une recherche de mots-clés. Exemple : +feature:video +simpsons

On peut également appliquer les operateurs de recherche sur plusieurs mots à l'aide des parenthèses :
+title:(guide new york)
+(adaptations cinématographiques oeuvres littéraires) -(droits auteurs)
+"orange mécanique" -(film cinema)

Version beta de Voila :
http://www.voila.fr/beta