Les équipes de développement du moteur d'Orange ont mis en place un certain nombre de nouvelles fonctionnalités ces derniers mois. En voici une petite revue d'effectif...
Le moteur de recherche Orange, accessible directement depuis le site Lemoteur (m.lemoteur.fr sur mobile), est actuellemment disponible sur les portails Orange.fr (Web), Voila.fr (Web) et Orange World (Mobile).
Derrière ce moteur, une équipe d'environ 60 personnes travaille pour proposer des améliorations fonctionnelles et certaines innovations. Avez-vous remarqué les dernières en date ? En voici un rapide aperçu...
De l'information immédiate dès la liste-réponse
Source de l'image : Abondance |
Ces informations se déclenchent sur certains types de recherches comme "ligue1", "ligue2", "top14", sur les clubs de football ("om", "psg"), les calendriers sportifs mais aussi les people ("jean dujardin") , la recherche météo ("meteo marseille") , les villes ("nice"), etc.
De l'information aussi en images
Le moteur propose également de plus en plus de réponses avec visuels. Ainsi, pour les programmes télé, il est possible de savoir ce qui passe ce soir et revoir un programme de la veille lorsqu'on cherche à accéder au site internet d'une chaîne de télé.
Source de l'image : Abondance |
Des réponses de type "annuaire"
Vous recherchez un plombier, une boulangerie, un taxi ? Un annuaire, le 118 712, apporte ses résultats :
Source de l'image : Abondance |
Des progrès sur les fonctionnalités standards
Conscients que le chemin vers la pertinence absolue est long, les équipes d'Orange n'ont pas cessé d'améliorer les outils d'aide à la recherche et redressé certaines fonctionnalités standards : nettoyage de la liste réponse (suppression des faux 404*), amélioration des réponses sur des recherches dites de navigation, amélioration de la détection des contenus dupliqués, une auto-complétion avec correction intégrée, des recherches associées. Le moteur vidéo s'est enrichi du catalogue de Dailymotion et une nouvelle expansion volumétrique sur les documents francophones de qualité est en cours de route.
Faux 404 : Les robots de collecte des moteurs détectent et prennent en compte depuis toujours les requêtes http qui renvoie une code http "404 not found" (les "vrais 404"). Mais de nombreux sites renvoient ce type de requête vers des URL spécifiques de façon applicative et renvoient donc une page web avec un code http "200 ok", mais écrivent textuellement dans la page "désolé, cette page n’existe pas", par exemple. C’est la prise en compte de ce type de gestion des pages inconnues (les "faux 404") qui a évolué chez Orange.
Avis aux webmasters intéressés par de nouvelles visibilités web
Le moteur de recherche d'Orange génère près de 2,5 millions de recherches par jour. Notez qu'il est possible de soumettre vos sitemaps sur ce moteur à l'adresse http://referencement.ke.orange.fr.
Le moteur mobile
Le robot d'indexation est capable de détecter les redirections vers la version mobile de votre site en utilisant deux types de user agent :
- Iphone : "Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_1 like Mac OS X; fr-fr) AppleWebKit/532.9 (KHTML, like Gecko) Version/4.0.5 Mobile/ 8A306 Safari/ VoilaBot BETA 1.2 ( support.voilabot@orange-ftgroup.com)"
- Android : "Mozilla/5.0 (Linux; U; Android 2.3.6; fr-fr; GT-S5360 Build/GINGERBREAD) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1 VoilaBot BETA 1.2 (support.voilabot@orange-ftgroup.com)"
Il permet de découvrir du contenu mais aussi des redirections spécifiquement prévues pour les smartphones. Dans les pages de résultats sur mobile, c'est l'URL smartphone qui s'affiche dans les résultats.
En 2011, le moteur de recherche d'Orange a également enrichi ses listes réponses mobile sur tous les smartphones dont les iPhones et les terminaux sous Android. Aujourd'hui, 16% des recherches faites sur les moteurs d'Orange proviennent d'un mobile : recherche actualité ou people, programme TV, météo géolocalisée, accès rapide aux vidéos, accès boutique orange etc.
Vous pouvez le tester avec votre smartphone sur http://search.m.orange.fr/
Le moteur est aussi utilisé par les différentes chaines du groupe Orange
En 2011, cette technologie a également été déployée sur les services Orange comme la nouvelle TV d'Orange et sur des moteurs internes au portail Orange (assistance, boutique, orange actu, TV à la demande).
Tendances des requêtes
Autre nouveauté avec un analyseur des tendances des requêtes, sous la forme d'un nouvel algorithme d'analyse continue des requêtes qui permet de proposer, toutes les 2 heures, les requêtes représentatives de ce qui intéresse les internautes dans le domaine de l'actualité.
Un outil pratique pour découvrir les sujets qui buzzent et une source d'information sociologique sur nos propres usages du web et sur nos domaines d'intérêts.
Pour le moment, Lemoteur_trends se découvre au clic dans le cartouche sur lemoteur.fr ou sur un compte twitter dédié : @lemoteur_trends.
Une nouvelle complétion enrichie
Sur lemoteur.fr, des complétions enrichies de nombreuses informations apparaissent sur des recherches people ou météo. Ce nouvel espace d'informations apparait lorsque l'internaute survole la suggestion enrichie qui l'intéresse.
Source de l'image : Abondance |
La recherche sémantique
Le développement de la recherche sémantique se continue avec des questions/réponses et des algorithmes d'interprétation des requêtes tapées qui vont ensuite rechercher dans Wikipédia la réponse à la question posée. Par exemple, à la requête "qui est le réalisateur de the artist ?", la réponse est fournie directement, sans avoir besoin d'aller cliquer sur une des pages web :
Source de l'image : Abondance |
A noter que vous pouvez également questionner le moteur en langage naturel sur votre mobile (maire d'une ville, population, capitale ou plus généralement les questions sur les thèmes géopolitiques, personnalités célèbres ou le sport).
Un peu plus dans l'ombre, l'équipe travaille aussi sur une base de connaissances qui permettra de mieux comprendre le sens des recherches effectuées et d'exploiter la richesse du web.
Sachez pour terminer qu'en 2012, une véritable refonte en profondeur du moteur de recherche d'Orange est programmée. Mais nous aurons certainement l'occasion d'en reparler prochainement... 🙂
La recherche sémantique est quelque chose de formidable !
Plus de 47% des requêtes trouvent leurs réponses dans Wikipédia.
Bravo !
Continuez !
Pour la requête top14, on affiche les résultats de la 9ème journée car celle-ci contient le dernier match joué pour cause de report : Bordeaux-Bègles vs Lyon OU le 03/02/12.
Hello,
Je note vos réflexions et idées sur le sujet et les transmettrai à l'équipe en charge du moteur. N'hésitez pas à donner votre avis, négatif ou positif (et ils sont tous bons à prendre !), car il n'y a que comme cela que nous pourrons évoluer dans le bon sens.
Pas mal l'idée d'intégrer les résultats sportifs en tête de SERP.
Le seul problème : ce n'est pas forcément les résultats de la dernière journée qui ressortent (pour le Top 14 par ex, sur la requête "top14", il m'a affiché les résultats de la 9è journée alors que la dernière journée était la 16è…)
Encore des amélioration à prévoir donc. Mais en tout cas, des efforts notables.
Le pire de Google (inclusion de ses services propres) sans ses avantages (fraicheur d'actualisation, index important).
Continuez comme ça !
Le problème de ce moteur, ce n'est pas les fonctionnalités, c'est l'index. Faible et vieux.