Deux français, Fabrice Canel et Frédéric Dubut, occupent aujourd'hui des postes capitaux au sein des équipes chargées de développer et de maintenir le moteur de recherche Bing chez Microsoft. cet article a pour objectif de vous présenter leurs parcours et leur rôle au sein du moteur...
Bing, le moteur de recherche de Microsoft, se positionne comme concurrent numéro un (et, disons-le, le seul crédible) au niveau mondial face à Google. Mis à part quelques pays (Russie, République Tchèque, Chine, Corée du Sud, Japon entre autres), Bing représente une alternative quasi unique face à l'ogre de Mountain View dans la plupart des régions. Mois après mois, une équipe d'ingénieurs et de développeurs, pour la plupart basés à Seattle, consacre son temps à maintenir et améliorer la pertinence de ce moteur.
Ce que l'on sait moins, c'est que dans cette équipe travaillent plusieurs personnes originaires de l'Hexagone et, parmi elles, deux ont une visibilité de plus en plus forte au travers des conférences auxquelles elles participent (notamment lors des événements SEO), des billets de blogs officiels qu'elles rédigent, etc. car leurs responsabilités au sein du moteur sont devenues de plus en plus importantes au fil des jours. Il s'agit de Fabrice Canel et de Frédéric Dubut. Nous voulions donc vous les présenter en détail dans cet article.
Fabrice Canel, Principal Program Manager Crawling, Processing and Indexing
Fabrice Canel a débuté ses études supérieures en France au tout début d'Internet. Laissons-lui la parole : « Mosaic était à l'époque le premier navigateur web, la taille de l'internet ne dépassais pas 200 sites. Je passais mes journées à naviguer, à crawler toutes ces pages, ces sites… Et à attendre que les pages s'affichent. 🙂
Après avoir créé mon propre site, j'ai eu l'idée de connecter une base de données à une page web… C'était magique à l'époque … Mais je n'ai pas pensé à breveter cette idée :-). Après un court parcours de recherche de mathématiques appliquées, j'ai rejoint Microsoft France au mois d'avril 1997 afin de migrer leur application clients en web, et depuis, je n'ai pas quitté ce domaine, que ce soit pour optimiser le "search interne" sur les sites web de Microsoft, ou pour rejoindre MSN Search en 2006 puis Bing dans la foulée.
Depuis 13 ans, à Bing, je dirige en tant que chef de projet (Progam Manager) la découverte du contenu web, du crawler Bingbot et du traitement du contenu (indexation). Malheureusement, mes yeux ne suffisent plus pour lire et traiter les pages de l'ensembles des sites web… Les 200 sites web du début de l'Internet, sont devenus de milliards de sites web, des centaines de milliards de pages web. Pour satisfaire mes désirs de savoir et ceux de nos utilisateurs, je continue donc de pousser mes équipes chez Bing à créer une plateforme et une application avec pour objectif d'avoir l'index le plus frais, le plus riche, le plus propre, le plus complet et le plus intelligent du Web, contribuant à offrir à tous les utilisateurs de Bing des résultats opportuns et pertinents, dont ils peuvent avoir confiance. »
Vous pouvez retrouver Fabrice sur sa page LinkedIn
Fabrice Canel sur scène lors d'un salon SMX Advanced en 2018.
Source de l'image : Search Engine Land
Frédéric Dubut, Senior Program Manager Lead, Core Ranking
Frédéric Dubut a fait Polytechnique de 2003 à 2006, puis a passé un Master en Informatique à l’EPFL (Lausanne) de 2006 à 2008, après quoi il a rejoint Microsoft. Il travaille sur Bing depuis 2011 (avec un petit break de 2 ans chez Xbox de 2015 à 2017). Après quelques années à travailler sur le crawler (2011-2015), puis sur la lutte contre le spam (2017-2019), il est depuis peu Program Manager Lead pour la partie « Core Ranking », c'est-à-dire l’équipe qui travaille sur l'algorithme et détermine donc quels seront les 10 « liens bleus » (résultats naturels) affichés sur le moteur.
Pour en savoir plus sur son travail, vous pouvez regarder cette vidéo d'une interview qu'il a donnée à Barry Schwartz (des sites Search Engine Roundtable et Search Engine Land) :
Interview de Frédéric Dubut par Barry Schwartz.
Source de l'image : YouTube
Vous pouvez également retrouver Frédéric sur sa page LinkedIn
Notez également que vous pourrez retrouver Fabrice Canel et Frédéric Dubut au prochain événement Search Y à Paris le 7 février prochain.
Merci à tous les deux pour ces informations et bonne continuation dans vos tâches respectives !
@ Joseph : moi j’a un recaptcha sur leur page d’accueil…
Moi pas.
Comme je n’avais cité le cas qu’à titre anecdotique pour nos experts de Bing, restons-en là dans cette aimable conversation.
Merci d’avoir répondu à mes messages.
Pour ces deux experts de Bing:
Je ne parviens pas à comprendre pourquoi sur une simple requête Thai Smile, le site officiel de cette compagnie thaïlandaise (filiale de Thai Airways) n’apparaît pas du tout dans les résultats chez Bing!
Peut-être parce que le site est interdit aux robots ? https://www.thaismileair.com/
En tous cas, il est premier chez Google.
Et utilisant Bing de + en + souvent (avec satisfaction), j’ai été surpris de ne pas trouver du tout le site attendu (du moins dans les premières pages) chez Bing, et ce dans des recherches espacées de plusieurs jours (un bug passager est toujours possible).
Reprenant le cas aujourd’hui et en ajoutant « airways » à la requête, il y a une page d’accès au compte client de la compagnie aérienne qui apparaît dans les résultats, mais rien d’autre de cette compagnie.
Tout ceci pour info. Ce n’est pas un drame.
Effectivement premier sur Google. Du coup, je suis partagé entre 2 sentiments :
1. Bravo Googlebot pour avoir passé l’obstacle sur la page d’accueil.
2. Si le site ne veut pas que les robots lise ses pages (et c’est bien ce qui est expliqué sur la page d’accueil), est-il normal que Google l’indexe ?
Ceci dit, le premier fautif me semble être l’éditeur du site qui met un obstacle dès la première page aux robots de moteurs. Sauf s’il ne veut pas être indexé…
Je ne vois pas l’interdiction aux robots invoquée.
Sauf erreur de ma part, le nofollow noindex est uniquement sur leur http, mais pas sur le https.
Et il n’y a pas de fichier robots.txt