Le moteur de recherche Xaphir a vu le jour il y a quelques semaines de cela. D'origine française avec un index et un algorithme 'maison', il a pour ambition de bousculer l'ordre établi dans le domaine si fermé du 'search' en France et dans le monde. Nous avons posé 7 questions à Eric Mathieu, cofondateur de Xilopix, l'entreprise à la base de ce projet.
Le moteur de recherche Xaphir a vu le jour il y a quelques semaines de cela. Conçu par une équipe basée à Epinal, il est actuellement disponible en version bêta (ce qui explique en grande partie la qualité moindre de ses résultats pour l'instant). Il n'en reste pas moins intéressant car il s'agit d'un des (très) rares moteur d'origine française utilisant une technologie "maison" (Qwant, de son côté, est toujours, et ce depuis ses débuts, majoritairement basé sur l'index et l'algorithme de Bing, le moteur de recherche de Microsoft).
Il nous a donc semblé intéressant de poser quelques questions à Eric Mathieu, le fondateur de Xilopix, la société qui a imaginé Xaphir. Voici ses réponses...
Pouvez-vous nous retracer en quelques mots la genèse du projet Xaphir ?
J’étais fasciné par Google et Wikipédia depuis bon nombre d'années, et je me disais qu’une solution à l’intersection de ces deux services remporterait un vif succès, à savoir : une plateforme collaborative d’échange et de partage de documents médias, reposant sur une technologie innovante d’indexation et de recherche des contenus, dont j’avais établi les principes de fonctionnement autour de 3 innovations dont je parlerai tout à l'heure.
N’étant pas moi-même informaticien, je réussi à convaincre Cyril March, alors jeune ingénieur Epita, de m’accompagner dans cette aventure et de créer ensemble la société fin 2008.
Fin 2009, il nous apparait que l’approche technologique de notre moteur de recherche pourrait résoudre notre double objectif.
Aussi décidons-nous en 2010 de nous concentrer sur le seul développement du moteur de recherche.
En 2011, nous déplaçons la société dans le Grand Est pour la rapprocher de ses partenaires scientifiques issus de laboratoires du CNRS et de l’INRIA de la région. Nous atterrissons finalement à Epinal où la Mairie et la Communauté d’Agglomération nous proposent des conditions d’accueil remarquables.
L’équipe que nous avons réussi à bâtir à Epinal est exceptionnelle, plurielle et universelle avec des hommes et des femmes de 23 à 57 ans. Elle est composée de 35 personnes hautement qualifiées, dont 28 à la Recherche et au Développement représentant 9 nationalités, 11 langues parlées et écrites et 4 alphabets maîtrisés.
Après un peu plus de 7 années de R&D, Xaphir voit enfin le jour le 31 mars 2017, avec des innovations technologiques et une expérience utilisateur inédite, sur un marché qui n’a pas connu d’innovation majeure depuis près de vingt ans.
Quel est l'objectif de Xaphir ? Comment vous positionnez-vous par rapport aux grands du domaine comme Google ou Bing ?
Notre ambition est d’entrer dans le cercle très fermé des 5 plus grands moteurs de recherche de ce monde à l’horizon 2020. Pensé à l’ère du multimédia et de la révolution tactile, Xaphir est un moteur de nouvelle génération à la croisée du Web sémantique et du Web de l’image.
Construit sur la base de trois innovations majeures (qui font l’objet de brevets internationaux), Xaphir permet simultanément et pour la première fois, ce qu’aucun autre moteur n’a réussi à faire à ce jour :
1. Combiner dans la barre de recherche des formats hétérogènes, qu’il s’agisse de textes, d’images ou de vidéos ;
2. Affiner sa page de résultats par des itérations successives, en choisissant ou excluant les résultats proposés par un simple clic ;
3. Explorer visuellement et tactilement pour chercher et trouver de manière intuitive et ludique (une version mobile du moteur sera proposée dès cet été).
Ce faisant, Xaphir apporte des qualités nouvelles qui :
- Permettent d'obtenir un moteur beaucoup mieux adapté aux terminaux multimédias les plus récents (objets connectés, smartphones, tablettes, TV connectées, etc.) que les moteurs actuels ;
- Autorisent un modèle économique inédit, ;
- Redonnent le pouvoir à l’utilisateur qui garde la main sur sa page de résultats à l’inverse de l’approche « shoot and miss » des moteurs traditionnels ;
- Amélioreront progressivement la pertinence des résultats de recherche dans le respect des exigences de diversité, d’impartialité et d’universalité.
La capacité itérative (possibilité d’affiner sa page de résultats), permet en particulier :
- De mieux valoriser le Web, telle une charrue retournant la terre avec son soc, et d’accéder ainsi à du Web plus profond ;
- Un moteur auto-apprenant sur la base d’une puissante intelligence artificielle que nous allons progressivement intégrer ; Grâce notamment à l’analyse des cessions, de leurs profils de requêtes et de leurs résultats, nous allons pouvoir faire des rapprochements, en tirer des enseignement, et réduire par apprentissage le nombre des itérations ; si vous aviez mis 5 itérations pour arriver à votre résultat, le moteur saura quoi faire pour diminuer le nombre des itérations pour les prochaines fois.
- D’être respectueux de la vie privée des utilisateurs.
À la différence des autres moteurs de recherche, Xaphir privilégie le respect des exigences de Diversité, d’Impartialité et d’Universalité au détriment du PageRank pour offrir une meilleure lecture du Web et finalement un meilleur accès à la Connaissance.
Le respect de ces exigences, conditions incontournables de l’accomplissement de bonnes itérations, enferme Xaphir dans un principe vertueux.
En effet, leur non-respect étoufferait l’avantage concurrentiel du fonctionnement itératif et de la capacité d’auto-apprentissage de Xaphir.
Quelques questions techniques : La technologie est-elle entièrement propriétaire (robots, index, algorithmes) ? Utilisez-vous des briques Open Source ? Quel est le nom du robot utilisé ? Quelle est la taille de votre index ?
La technologie est entièrement propriétaire, qu’il s’agisse de notre robot, de nos algorithmes ou de nos index. Nous utilisons en effet des briques Open Sources pour nos développements, nos tests, et nos bases de données, c’est aussi une culture d’entreprise.
Pour le moment nous ne communiquons pas sur la taille de notre index.
Nous travaillons avec OVH et Orange pour nos infrastructures.
Que signifie le nom Xaphir ?
Xaphir vient de X et de Saphir. Dans la science des mathématiques, X est notamment cette inconnue que l’on doit trouver. Le Saphir est une pierre précieuse de couleur bleue, à qui l’on attribue bien des vertus à travers maints contes et légendes.
Il est une légende très ancienne qui nous parle d’un livre de sagesse, dénommé Livre de Saphir, dans lequel l’Eternel aurait consigné tous les secrets de l’univers pour un accès à la Connaissance ultime.
Xaphir contient donc l’inconnue et sa solution, votre recherche et notre réponse que nous ne cesserons d’améliorer dans le respect de la diversité, de l’impartialité et de l’universalité.
Quel est, ou quel sera, le modèle économique de Xaphir ?
À un nouveau paradigme de recherche correspond un nouveau modèle de revenus publicitaires. Ce modèle économique inédit, ouvre une nouvelle façon d’aborder la publicité en ligne. Non construit sur la captation des données personnelles, il garantit et protège ainsi aussi la vie privée des utilisateurs.
Il s’agit de :
- La publicité itérative : le profilage de l’intention en temps réel des actions de l’utilisateur, par l’affinage progressif de la publicité dans le même temps que celui de sa page de résultats ;
- La publicité participative : la possibilité de construire des requêtes à partir d’une publicité, par un simple glisser/coller dans la barre de recherche.
Ce modèle de revenus qui sera prochainement et progressivement déployé, fait également l’objet de dépôts de brevets.
Quelles sont les prochaines étapes importantes pour ce moteur et à quelles dates ?
Xaphir est aujourd’hui disponible en français. Notre priorité, d’ici le mois de septembre, est d’améliorer ses performances, de l’enrichir de nouvelle fonctionnalités, de sortir une version mobile, et d’augmenter considérablement le volume de contenus proposé pour l’ensemble de la francophonie européenne.
Ceci fait, Xaphir commencera alors à s’internationaliser, d’abord en Europe, avant la fin de cette année.
Les premiers tests effectués sur Xaphir semblent assez décevants (voir par exemple ci-dessous le résultat pour la recherche "abondance"), certainement dû à un index trop faible quantitativement. N'avez-vous pas peur d'un "effet Cuil"* ?
Je souhaiterais insister sur les points suivants :
- Xaphir est encore un tout jeune Moteur de Recherche, à peine plus d’un mois de mise en ligne, qui effectue ses premiers pas, apprenant en marchant ;
- Il comporte à ce jour bien des imperfections, c’est pourquoi nous faisons appel à l’indulgence et la compréhension de nos utilisateurs ;
- Au cours des semaines et des mois qui viennent, nous ne cesserons de faire progresser ses performances, de l’enrichir de nouvelles fonctionnalités, et de présenter une lecture toujours plus pertinente et abondante du Web ;
- Nos équipes sont donc à votre écoute pour améliorer Xaphir sur un plan collaboratif ;
- Nous encourageons donc vos lecteurs à nous faire part de leurs observations et de leurs suggestions pour que Xaphir en grandissant, devienne non seulement un grand Moteur, mais aussi LEUR Moteur. Par avance, nous les remercions pour leur collaboration et leur précieux soutien qui permettront à Xaphir de toujours mieux respecter ses engagements.
* : Cuil était un moteur de recherche américain, créé en 2008 par des pointures du domaine dont Louis Monier (Altavista, Google, etc.). Il a très vite périclité et s'est arrêté 2 ans plus tard car il avait été lancé trop vite (par décision des actionnaires), alors que la pertinence de ses résultats n'était pas encore au rendez-vous.
Résultat de recherche sur Xaphir pour la requête "abondance"... Source de l'image : Ahrefs |
On ne peut que souhaiter à ceux qui entreprennent des choses de réussir. Cela dit, avec Google qui truste 93% des recherches, le top 5 est largement atteignable. Par exemple, Qwant a été positionné comme moteur de recherche par défaut dans de nombreuses administrations. Un coup de pouce qui lui permet d’intégrer aujourd’hui ce fameux top 5 !
Bonjour. Je suis preneur de la source indiquant que Qwant est dans le Top 5 des moteurs en France à l’heure actuelle ! Une URL proposant ces chiffres ? Une source fiable ? Merci !
Bonjour, effectivement je m’avance un peu sur Qwant dans le Top 5. J’ai juste essayé de compter ceux qui se situaient avant lui : Google, Bing, Yahoo, Orange-Voilà (pas sûr). Avec le coup de pouce dans le secteur public, Qwant doit avoir sa place dans ce classement.
Par ailleurs je ne vois pas comment il pourrait y avoir une source fiable sur ce sujet, cela signifierait que les moteurs communiquent eux-même leurs chiffres sur une base commune. Il y a une grosse part d’intox à ce jeu là.
La seule source un tant soit peu fiable à ce sujet est http://gs.statcounter.com/search-engine-market-share/all/france
Je ne connaissais pas… Intéressant! Un projet un peu fou (comme dit plus haut c’est culotté en 2017) mais on ne peut que lui souhaiter de réussir! Il y a un énorme manque de diversité chez les moteurs de recherche… (au regard des parts de marché de chacun)
Je n’avais pas tout vu/lu : http://www.rtl.fr/culture/futur/xaphir-un-moteur-de-recherche-made-in-moselle-pour-concurrencer-google-7788615575
10 millions d’euros … ya de quoi faire … 0€ de CA … ya de quoi frémir…
Une campagne de com mal lancée, trop tôt, une interface utilisateur sans test de la communauté, un modèle économique absent, 35 personnes qui travaillent sur ce projets (???????) …
Moi qui pensait que ce projet était au stade de developpement et réalisé par tout au plus 2 ou 3 amis courageux, la réalité est tout autre… et en l’état, c’est vrai, prête à sourire un peu…
Bon, à suivre…
Pour faire avancer :
– Le terme a decocher dans la barre de recherche lorsque l’on change le ou les mots est désagréable.
– comme ci-dessus, limiter les résultats a 3 pour le même site serait bienvenue.
Et puis la sémantique pour une pertinence, ca reste le coeur de la réussite…
Mes premiers essais ne sont pas concluants tant il est vrai que le nombre de sources est infinitésimal. J’ai fait une recherche sur un framework de développement PHP et j’ai eu des dizaines de pages de tuto du site grafikarts. Pourquoi pas, mais il manque des dizaines et des dizaines d’autres sites tout aussi pertinents. Pour une autre recherche le moteur Xaphir affiche une date qui est peut-être celle de l’indexation du document, mais pas celle de la création du dit document. Bref il y a du travail, bon courage aux équipes !
Points positifs : les découpes d’interfaces et la rapidité de chargement des pages de résultats.
D’une part, Xaphir dit qu’il respecte la vie privée des internautes. D’autre part, il est fortement basé sur un système itératif qui enregistre et réagit au comportement de l’internaute.
Ces deux affirmations me paraissent totalement contradictoires, à moins de considérer que le comportement et les choix de l’internaute ne font pas partie de sa vie privée.
Si ce caractère itératif est original, le but qu’il poursuit (moteur auto-apprenant) est cependant commun à tous les moteurs. Google y arrive par une autre voie: dès ses débuts, il a épié et espionne encore le comportement de l’internaute par de nombreuses voies. En partie (pas entièrement), les deux méthodes visent la même chose.
Même si j’ai horreur de l’exploitation des données personnelles par Google, je préfère encore sa méthode. Une recherche dans Xaphir sur les voyages me donne des résultats où Webrankinfo apparaît une septantaine de fois. Je ne vais pas passer mon temps à désactiver ces résultats non pertinents. Et ce même s’il n’y en avait que 4 ou 5. Si le même résultat apparaissait chez Google et, comme il espionne l’internaute, les fois suivantes, il éliminerait par lui-même les résultats non pertinents. Donc, plus simple pour l’internaute.
Quant à voir si le système de Xaphir permet » d’ accéder à du web plus profond », je crois que ce n’est pas seulement un problème de méthode, mais surtout un problème d’index et là, ce n’est pas demain, qu’un nouveau moteur va battre Google.
En particulier, à l’international et au multilangue, Google a une avance immense sur tous ses concurrents, y compris Bing pourtant en fonction depuis des années. C’est dans la bonne prise en compte de l’international et du multilangue qu’on teste le niveau critique de qualité de la pertinence d’un moteur.
Bravo pour le courage déjà, faut être culotté en 2017 pour lancer un moteur, et le courage, c’est une belle qualité tant qu’on garde les pieds sur terre.
Je préfère de loin l’initiative de « recherche et développement » de XAPHIR a celle de qwant que j’ai fustigé récement pour avoir longuement caché qu’au départ ce n’était qu’un méta moteur basé sur Bing (encore ce jour), et obtenu des dizaines de millions de subventions d’aide. Ca fait cher le script au contribuable (15 millions € de la caisse des dépôts mais lol quoi) … maintenant c’est dépensé .. y’a plus qu’a avancer pour Qwant…
Xaphir est un peu « désorientant » dans sa présentation, mais pour une première mouture, Qwant l’était tout aussi … donc donnons le temps et nos avis constructifs a ces courageux entrepreneurs … 🙂 . Pour la technique, on le sait que trop bien, faire un moteur de A à Z c’est titanesque, vraiment (crawl, sémantique etc …).
… Et pssit , les politiques, une petite subvention pour Xaphir peut-être aussi non?.
Bon courage !
Souhaitons lui bonne chance !