Eric Mathieu (Xaphir) : Nous voulons faire partie des 5 plus gros moteurs mondiaux d'ici 2020

Le moteur de recherche Xaphir a vu le jour il y a quelques semaines de cela. D'origine française avec un index et un algorithme 'maison', il a pour ambition de bousculer l'ordre établi dans le domaine si fermé du 'search' en France et dans le monde. Nous avons posé 7 questions à Eric Mathieu, cofondateur de Xilopix, l'entreprise à la base de ce projet.

Le moteur de recherche Xaphir a vu le jour il y a quelques semaines de cela. Conçu par une équipe basée à Epinal, il est actuellement disponible en version bêta (ce qui explique en grande partie la qualité moindre de ses résultats pour l'instant). Il n'en reste pas moins intéressant car il s'agit d'un des (très) rares moteur d'origine française utilisant une technologie "maison" (Qwant, de son côté, est toujours, et ce depuis ses débuts, majoritairement basé sur l'index et l'algorithme de Bing, le moteur de recherche de Microsoft).

Il nous a donc semblé intéressant de poser quelques questions à Eric Mathieu, le fondateur de Xilopix, la société qui a imaginé Xaphir. Voici ses réponses...

Pouvez-vous nous retracer en quelques mots la genèse du projet Xaphir ?

Eric Mathieu (Xaphir)

J’étais fasciné par Google et Wikipédia depuis bon nombre d'années, et je me disais qu’une solution à l’intersection de ces deux services remporterait un vif succès, à savoir : une plateforme collaborative d’échange et de partage de documents médias, reposant sur une technologie innovante d’indexation et de recherche des contenus, dont j’avais établi les principes de fonctionnement autour de 3 innovations dont je parlerai tout à l'heure.
N’étant pas moi-même informaticien, je réussi à convaincre Cyril March, alors jeune ingénieur Epita, de m’accompagner dans cette aventure et de créer ensemble la société fin 2008.
Fin 2009, il nous apparait que l’approche technologique de notre moteur de recherche pourrait résoudre notre double objectif.
Aussi décidons-nous en 2010 de nous concentrer sur le seul développement du moteur de recherche.
En 2011, nous déplaçons la société dans le Grand Est pour la rapprocher de ses partenaires scientifiques issus de laboratoires du CNRS et de l’INRIA de la région. Nous atterrissons finalement à Epinal où la Mairie et la Communauté d’Agglomération nous proposent des conditions d’accueil remarquables.
L’équipe que nous avons réussi à bâtir à Epinal est exceptionnelle, plurielle et universelle avec des hommes et des femmes de 23 à 57 ans. Elle est composée de 35 personnes hautement qualifiées, dont 28 à la Recherche et au Développement représentant 9 nationalités, 11 langues parlées et écrites et 4 alphabets maîtrisés.
Après un peu plus de 7 années de R&D, Xaphir voit enfin le jour le 31 mars 2017, avec des innovations technologiques et une expérience utilisateur inédite, sur un marché qui n’a pas connu d’innovation majeure depuis près de vingt ans.

Quel est l'objectif de Xaphir ? Comment vous positionnez-vous par rapport aux grands du domaine comme Google ou Bing ?

Notre ambition est d’entrer dans le cercle très fermé des 5 plus grands moteurs de recherche de ce monde à l’horizon 2020. Pensé à l’ère du multimédia et de la révolution tactile, Xaphir est un moteur de nouvelle génération à la croisée du Web sémantique et du Web de l’image.
Construit sur la base de trois innovations majeures (qui font l’objet de brevets internationaux), Xaphir permet simultanément et pour la première fois, ce qu’aucun autre moteur n’a réussi à faire à ce jour :
1. Combiner dans la barre de recherche des formats hétérogènes, qu’il s’agisse de textes, d’images ou de vidéos ;
2. Affiner sa page de résultats par des itérations successives, en choisissant ou excluant les résultats proposés par un simple clic ;
3. Explorer visuellement et tactilement pour chercher et trouver de manière intuitive et ludique (une version mobile du moteur sera proposée dès cet été).

Ce faisant, Xaphir apporte des qualités nouvelles qui :
- Permettent d'obtenir un moteur beaucoup mieux adapté aux terminaux multimédias les plus récents (objets connectés, smartphones, tablettes, TV connectées, etc.) que les moteurs actuels ;
- Autorisent un modèle économique inédit, ;
- Redonnent le pouvoir à l’utilisateur qui garde la main sur sa page de résultats à l’inverse de l’approche « shoot and miss » des moteurs traditionnels ;
- Amélioreront progressivement la pertinence des résultats de recherche dans le respect des exigences de diversité, d’impartialité et d’universalité.

La capacité itérative (possibilité d’affiner sa page de résultats), permet en particulier :
- De mieux valoriser le Web, telle une charrue retournant la terre avec son soc, et d’accéder ainsi à du Web plus profond ;
- Un moteur auto-apprenant sur la base d’une puissante intelligence artificielle que nous allons progressivement intégrer ; Grâce notamment à l’analyse des cessions, de leurs profils de requêtes et de leurs résultats, nous allons pouvoir faire des rapprochements, en tirer des enseignement, et réduire par apprentissage le nombre des itérations ; si vous aviez mis 5 itérations pour arriver à votre résultat, le moteur saura quoi faire pour diminuer le nombre des itérations pour les prochaines fois.
- D’être respectueux de la vie privée des utilisateurs.

À la différence des autres moteurs de recherche, Xaphir privilégie le respect des exigences de Diversité, d’Impartialité et d’Universalité au détriment du PageRank pour offrir une meilleure lecture du Web et finalement un meilleur accès à la Connaissance.
Le respect de ces exigences, conditions incontournables de l’accomplissement de bonnes itérations, enferme Xaphir dans un principe vertueux.
En effet, leur non-respect étoufferait l’avantage concurrentiel du fonctionnement itératif et de la capacité d’auto-apprentissage de Xaphir.

Quelques questions techniques : La technologie est-elle entièrement propriétaire (robots, index, algorithmes) ? Utilisez-vous des briques Open Source ? Quel est le nom du robot utilisé ? Quelle est la taille de votre index ?

La technologie est entièrement propriétaire, qu’il s’agisse de notre robot, de nos algorithmes ou de nos index. Nous utilisons en effet des briques Open Sources pour nos développements, nos tests, et nos bases de données, c’est aussi une culture d’entreprise.
Pour le moment nous ne communiquons pas sur la taille de notre index.
Nous travaillons avec OVH et Orange pour nos infrastructures.

Que signifie le nom Xaphir ?

Xaphir vient de X et de Saphir. Dans la science des mathématiques, X est notamment cette inconnue que l’on doit trouver. Le Saphir est une pierre précieuse de couleur bleue, à qui l’on attribue bien des vertus à travers maints contes et légendes.
Il est une légende très ancienne qui nous parle d’un livre de sagesse, dénommé Livre de Saphir, dans lequel l’Eternel aurait consigné tous les secrets de l’univers pour un accès à la Connaissance ultime.
Xaphir contient donc l’inconnue et sa solution, votre recherche et notre réponse que nous ne cesserons d’améliorer dans le respect de la diversité, de l’impartialité et de l’universalité.

Quel est, ou quel sera, le modèle économique de Xaphir ?

À un nouveau paradigme de recherche correspond un nouveau modèle de revenus publicitaires. Ce modèle économique inédit, ouvre une nouvelle façon d’aborder la publicité en ligne. Non construit sur la captation des données personnelles, il garantit et protège ainsi aussi la vie privée des utilisateurs.
Il s’agit de :
- La publicité itérative : le profilage de l’intention en temps réel des actions de l’utilisateur, par l’affinage progressif de la publicité dans le même temps que celui de sa page de résultats ;
- La publicité participative : la possibilité de construire des requêtes à partir d’une publicité, par un simple glisser/coller dans la barre de recherche.
Ce modèle de revenus qui sera prochainement et progressivement déployé, fait également l’objet de dépôts de brevets.

Quelles sont les prochaines étapes importantes pour ce moteur et à quelles dates ?

Xaphir est aujourd’hui disponible en français. Notre priorité, d’ici le mois de septembre, est d’améliorer ses performances, de l’enrichir de nouvelle fonctionnalités, de sortir une version mobile, et d’augmenter considérablement le volume de contenus proposé pour l’ensemble de la francophonie européenne.
Ceci fait, Xaphir commencera alors à s’internationaliser, d’abord en Europe, avant la fin de cette année.

Les premiers tests effectués sur Xaphir semblent assez décevants (voir par exemple ci-dessous le résultat pour la recherche "abondance"), certainement dû à un index trop faible quantitativement. N'avez-vous pas peur d'un "effet Cuil"* ?

Je souhaiterais insister sur les points suivants :
- Xaphir est encore un tout jeune Moteur de Recherche, à peine plus d’un mois de mise en ligne, qui effectue ses premiers pas, apprenant en marchant ;
- Il comporte à ce jour bien des imperfections, c’est pourquoi nous faisons appel à l’indulgence et la compréhension de nos utilisateurs ;
- Au cours des semaines et des mois qui viennent, nous ne cesserons de faire progresser ses performances, de l’enrichir de nouvelles fonctionnalités, et de présenter une lecture toujours plus pertinente et abondante du Web ;
- Nos équipes sont donc à votre écoute pour améliorer Xaphir sur un plan collaboratif ;
- Nous encourageons donc vos lecteurs à nous faire part de leurs observations et de leurs suggestions pour que Xaphir en grandissant, devienne non seulement un grand Moteur, mais aussi LEUR Moteur. Par avance, nous les remercions pour leur collaboration et leur précieux soutien qui permettront à Xaphir de toujours mieux respecter ses engagements.

* : Cuil était un moteur de recherche américain, créé en 2008 par des pointures du domaine dont Louis Monier (Altavista, Google, etc.). Il a très vite périclité et s'est arrêté 2 ans plus tard car il avait été lancé trop vite (par décision des actionnaires), alors que la pertinence de ses résultats n'était pas encore au rendez-vous.

xaphir-serp
Résultat de recherche sur Xaphir pour la requête "abondance"... Source de l'image : Ahrefs