Greg Corrado, un ingénieur travaillant chez Google, a récemment donné quelques indications sur RankBrain, l'algorithme basé sur des méthodes d'intelligence artificielle et d'apprentissage automatique, qui traite déjà actuellement 15% des requêtes reçues par le moteur de recherche chaque jour...
Sundar Pichai (voir illustration ci-dessous), CEO de Google depuis la création d'Alphabet, a rappelé lors de la présentation des résultats financiers de sa holding pour le troisième trimestre 2015, toute l'importance qu'ont l'intelligence artificielle et les méthodes d'apprentissage automatique (machine learning) dans les algorithmes aujourd'hui utilisés par Google et notamment son moteur de recherche. Des technologies bien connues des lecteurs de notre lettre professionnelle "Recherche & Référencement qui en parle... abondamment tous les mois.
Il a, à cette occasion, indiqué qu'actuellement, plus de 15% des requêtes chaque jour étaient traitées par le moteur de recherche grâce à ces méthodes et notamment un algorithme baptisé RankBrain qui serait fortement lié à Hummingbird, et basé sur la compréhension, le sens des mots et expressions, tout comme les liaisons sémantiques entre eux. Le site Bloomberg a notamment mis en ligne une interview de Greg Corrado, senior research scientist chez Google, qui a travaillé sur le sujet et explique ce qu'est ce RankBrain.
L'idée principale est, dans un premier temps, de convertir les données du Web en vecteurs mathématiques qu'un ordinateur peut interpréter. Si l'algorithme RankBrain identifie un vecteur peu courant, qu'il ne connait pas, il va essayer de "deviner" son sens au travers d'autres vecteurs approchant. Il va ainsi se perfectionner pour de nouvelles analyses, etc. D'où la notion d'apprentissage automatique.
Greg Corrado explique également que RankBrain est devenu, au fil du temps, le troisième critère de pertinence le plus important utilisé par Google pour lister ses résultats. Non, il ne dit pas quels sont les deux premiers ! 🙂
Notez que la lettre professionnelle "Recherche & Référencement du mois de novembre prochain consacrera un article à ce RankBrain, qui semble si important aujourd'hui pour le moteur de recherche majeur, pour compléter sa série d'articles sur l'apprentissage automatique et l'intelligence artificielle appliqués au monde de la recherche sur le Web.
Sundar Pichai, CEO de Google. Source de l'image : DR |
@Mathieu Chartier Cet algo n’a rien a voir avec un quelconque critère de pertinence des pages web. Il ne traite pas les pages web, il traite ce que demande l’internaute, la requête .
L’objectif de Google, c’est le cash, la croisance. « Mieux comprendre » la requête pour mieux décider ensuite si cela peut favoriser des services payants ou non. Depuis bien longtemps, Google est arrivé a une optimisation quasi optimum du classement des pages web. Quand il y a trop de dérives, il durcit des filtres, en crée de nouveaux.
Dans ce cas précis, l’objectif est de mieux comprendre pour mieux vendre, il ne faut pas se voiler la face.
Google a désormais une panoplie de services payant , et des données multiples propres :
– shopping
– annuaire d’entreprise
– résultats web
– annonces texte adwords (oui, c’est aussi du contenu )
RankBrain est là pour comprendre l’internaute, et aller chercher ce qui est vendable, le placer a la meilleure place possible tout en restant pertinent pour l’internaute, et placer le reste ensuite.
Il faut rembobiner le film de l’évolution de Google sur plusieurs années en arrière pour voir le cheminement que celui-ci a pris peu à peu pour comprendre où va ce moteur. En dehors de la morale, c’est l’évolution logique d’une entreprise commerciale.
Rassure-toi j’ai bien compris ça depuis le temps ! ^^
J’apportais juste cette précision car je ne mélange pas les critères de pertinence au sens du ranking, et les autres. Ici, c’est une très belle évolution technologique à mes yeux, qui devrait nous afficher encore plus de résultats pertinents. Je n’y vois pas que du mal derrière, mais comme toute entreprise, elle doit aussi faire manger ses salariés (et ses actionnaires…). 😀
C’est le côté du search que l’on apprécie, c’est passionnant tout en ayant un côté inquiétant en sachant que peu a peu, les programmes ne sont plus effectués par des humains. Il faut bien sûr l’intelligence d’un cerveau brillant au départ, c’est ce côté que l’on admire.
Il n’en reste pas moins que 85% des requêtes sont identiques, c’est colossal .
Dans son offre local business, google déclare d’ailleurs que 97% des internautes ont déjà effectués une recherche du type « activité + localité » . On reste donc a 97% dans des requetes simples qui n’ont nul besoin d’algorithmes complexe.
Ce type d’algo permet par contre a Google de renforcer l’affichage de son annuaire d’entreprise qu’il place désormais en 1ere position. Placé désormais devant tous les résultats naturel du web, pour Google, cette map et gros encart de 3 résultats d’entreprises (qu’elles aient ou pas un site web) n’est surement pas anodine vous vous en doutez bien.
L’objectif de Google est de faire payer cette position aux entreprises, parmi ces 3 premiers résultats d’annuaire, qui représentent la seule source de nouveaux revenus possible (vous ne pourrez pas faire payer un petit site de musique, un traiteur oui, un plombier aussi).
Cet algorithme (et les autres), permet d’associer par exemple des termes larges comme « Plats cuisinés surgelés paris » a une profession. Ce n’était pas le cas il y a quelques temps ! Le virage important qu’a pris Google pour aller puiser dans sont annuaire d’entreprise les professionnels concernés au lieu de purement sur le web comme c’était sont rôle de moteur au début , correspond a une demande croissante des internautes.
Après avoir fait croire stopper son annuaire (annuaire de site), google a déployé l’annuaire d’entreprise (50% des entreprises n’ont pas de site web donc étaient absente du moteur) , Google cherche désormais a placer cet annuaire de société en avant par tous les algorithmes possible. Autre exemple « liste de mariage paris » affiche aussi désormais l’annuaire d’entreprise de Google en 1ere position.
Petit a petit, un plus grand nombre de requêtes afficheront cet annuaire, car c’est là que le cash se trouve pour Google, plus que dans le shopping ou il patauge encore un peu.
C’est une déclaration de guerre aux grands annuaires nationaux et double casquette de Google (moteur et annuaire), a grand renfort d’algorithmes il est vrai remarquables technologiquement.
« L’objectif de Google est de faire payer cette position aux entreprises, parmi ces 3 premiers résultats d’annuaire, qui représentent la seule source de nouveaux revenus possible (vous ne pourrez pas faire payer un petit site de musique, un traiteur oui, un plombier aussi). »
Cet encart est géré par Google Maps (MyBusiness), et non par Adwords. De plus, le service a toujours été gratuit et je ne vois pas Google le faire payer de si tot, ce n’est pas dans leur politique habituelle.
Ce que tu appelles « Annuaire d’entreprises » représente ni plus ni moins le trio : MyBusiness, Maps, G+ et Adresses. G+ étant la partie visible pour les internautes, et Google fait tout pour que les internautes n’aillent plus sur G+ ! Plus de liens apparents dans les SERP, si bien qu’on peut se demander à quoi bon mettre des photos sur sa page…etc
Donc j’ai pas vraiment l’impression qu’ils mettent leurs services plus que ça en avant de ce côté là, et cette association Maps/site web permet d’avoir des résultats très pertinents, contrairement aux annuaires inutiles style PagesJaunes…
« Petit a petit, un plus grand nombre de requêtes afficheront cet annuaire, car c’est là que le cash se trouve pour Google, plus que dans le shopping ou il patauge encore un peu. »
Oui, et tu peux même taper des requêtes sans précisions géographiques pour avoir des propositions liées à Google Maps. Exemple, tu tapes un métier et Google sera susceptible de te proposer les boulangers à proximité…etc
Bref, aujourd’hui, un site avec une activité locale sans Google Maps, ça devient un vrai frein en terme de SEO je trouve.
Si l’entrée de la plateforme Google My Business est gratuite, elle ne cesse de proposer des services payants;
– la réalisation de la visite virtuelle Street View
– les photos de l’établissement
– une vidéo
– le suivi d’une page Google My Business
… pour le moment …
Le principe du type Annuaire n’est pas « inutile » loin de là, sinon Google, yahoo, bing ne s’y seraient pas mis. Après, les gouts et les couleurs…
Bonjour / Bonsoir Marc,
Je comprends tout à fait ce dont tu parles. Je tenais absolument à préciser par rapport à ton commentaire que, ça serait dommage qu’un seul groupe financer américain dirige de plus en plus les pays par du lobbying ou autre.
Néanmoins, l’IA pourrait (non pas pour le financier) mais pour quelque chose de plus humain :
– les maladies ou virus,
– la science (pour l’énergie infini (dans le respect de l’environnement)) et L’espace (big-bang)
– éducation populaire
– mixité sociale
-etc.
Voilà =) à pluch
Loïc.
Une question de novice, quel est le meilleur algorithmes d’apprentissage
J’aime bien celle-ci car je n’aime pas et ne sais pas bien parler l’angais;
http://blogs.msdn.com/b/big_data_france/archive/2013/04/24/apprentissage-automatique-machine-learning.aspx
et évidement celui-ci
https://www.abondance.com/actualites/20151110-15779-tensorflow-quand-google-devoile-ses-algorithmes-dapprentissage-automatique-en-open-source.html
Je ne suis pas un expert non plus dans le domaine.
Quelques petites remarques :
– RankBrain n’est sans doute pas un critère de classement/pertinence de l’algo, même si c’est le terme utilisé par le journaliste de Bloomberg. Ce serait vraiment comparer des choses incomparables.
– RankBrain (ou l’IA) n’est pas utilisé sur seulement 15% des requêtes, mais la plupart. Par contre il est bien meilleur que l’algo traditionnel sur les 15% de requêtes qui sont chaque jour nouvelles.
Vous trouverez d’autres détails dans mon article http://www.webrankinfo.com/dossiers/google-search/rankbrain
Ce rankbrain me fait fortement penser à la création d’un chatbot pour le loebner prize, j’en parlais dans un article début 2013 ou je la refaisais à l’envers
http://www.love-moi.fr/2013/01/web-semantique-intelligence.html que j’avais complété avec un article sur colibri
http://www.love-moi.fr/2013/10/colibri-hummingbird-la-learning-machine.html
Si on se rappelles bien, google nous a fait passer par l’adoption de schema.org pour normaliser nos réponses, ensuite ils ont racheté metaweb qui avait déja fait du classement, bizzarrement après ça on a eu des réponses direct qui sont apparues dans des box.
J’imagine qu’aujourd’hui ils ont industrialisé pour pouvoir identifier les requêtes inconnues et les rattacher à des requêtes plus standardisées. Officiellement l’analyse n’est pas automatique (vu sur un tweet réponse officielle)
Excellent article. J’avais lu l’article de Bloomberg à ce sujet hier mais j’avais gardé ça sous le coude.^^
En fait, je trouve ça un peu « étonnant » de qualifier RankBrain comme le 3e critère de pertinence, car si l’on regarde bien, il s’agit d’une énième surcouche qui traite les contenus (pour mieux les analyser et les comprendre). Au fond, on en revient donc aux contenus. Selon moi, cela signifie surtout que les contenus seront juste de plus en plus important.
Quand nous disons que le PageRank est un critère important, ça a une valeur également pratique et technique. Cela signifie qu’il faut obtenir des backlinks de qualité, etc. C’est concret.
Là, avec le RankBrain, que peut-on faire en réalité ? Il n’y a rien de 100% concret, c’est juste une surcouche technique (de haut vol !) qui analyse encore mieux les contenus et leurs relations sémantiques. Donc au fond, je vois plus ça comme un algorithme qui prouve encore une fois que les contenus ont un rôle de plus en plus important pour Google. Après, je ne vois pas concrètement ce qu’on va pouvoir faire de plus que des cocons sémantiques ou autres. 😀