Google promet une avancée majeure dans la recherche en ligne avec son brevet US11769017B1, qui introduit SGE, le moteur de recherche basé sur l'intelligence artificielle lancé par Google en version bêta il y a quelques mois.
Ce qu'il faut retenir :
- Le brevet de Google présente un système de résumés de recherche générés par IA, soit la Search Generative Experience ;
- Il a été soumis le 20 mars, quelques semaines avant le lancement de la SGE ;
- Les étapes clés du fonctionnement de la SGE sont expliquées dans le brevet, ainsi que la sélection des liens.
Le brevet de la SGE
Le brevet US11769017B1, soumis le 20 mars (soit quelques semaines avant le lancement bêta de la SGE), décrit l'utilisation de modèles de langage à grande échelle pour générer des résumés de résultats de recherche. Cette technologie permet de traiter des requêtes complexes, offrant des résumés enrichis par l'IA avec des liens vers des informations complémentaires.
Voici le tweet de Juan Gonzalez Villa, qui a découvert ce brevet décrivant visiblement le fonctionnement de la SGE :
🔴 BREAKING: Here's Google's patent behind Google's SGE, their experimental search engine with AI generated results.
— Juan González Villa (@seostratega) November 29, 2023
This patent was filed on March 20th, a few weeks before the first announcement and beta release of SGE.
Here's how SGE works, according to the patent... 🧵⤵ pic.twitter.com/VqmX9Ef7Fs
A noter : il n’existe actuellement aucun autre brevet de Google traitant d’IA générative dans la recherche.
Les étapes clés du fonctionnement de la SGE
Le brevet de Google, intitulé "Generative summaries for search results", décrit un processus innovant pour améliorer l'expérience de recherche en ligne. Les étapes clés comprennent :
- Réception d'une requête : Le système reçoit une requête associée à un appareil client, pouvant être saisie explicitement par un utilisateur ou générée automatiquement en fonction du contexte.
- Sélection de documents : Il sélectionne un ensemble de documents de résultats de recherche (SRD) répondant à la requête et à des requêtes connexes ou récentes.
- Génération de snippets : Des extraits de contenu correspondants sont générés pour chaque SRD, incluant du texte, des images, du contenu vidéo, etc., sélectionnés en fonction de leur corrélation avec les requêtes.
- Traitement par LLM : Les extraits de contenu des SRD sont traités à l'aide d'un modèle de langage à grande échelle (LLM) pour générer une sortie LLM. Un prompt de résumé optionnel peut également être inclus.
- Création de résumés : Un résumé en langage naturel est généré en utilisant la sortie LLM, tirant parti de la robustesse du LLM tout en le limitant au contenu des SRD.
- Affichage sur l'appareil client : Le résumé est rendu sur l'appareil client, accompagné de résultats de recherche optionnels, d'annotations de confiance, de liens vers des SRD, etc.
Ce processus illustre l'approche de Google pour intégrer l'intelligence artificielle dans la recherche en ligne, visant à fournir des résumés précis et contextuellement pertinents qui améliorent l'expérience utilisateur tout en restant fidèles aux sources d'information originales.
Les liens sélectionnés dans les réponses instantanées
Une caractéristique notable du brevet Google SGE est le mécanisme de vérification des informations. Lorsque le résumé en langage naturel est affiché, il inclut des liens sélectionnables qui renvoient aux documents de résultats de recherche (SRD) corroborant certaines parties du résumé.
Ces liens permettent aux utilisateurs de vérifier rapidement les éléments du résumé et d'accéder au contenu de vérification. Par exemple, une partie du résumé soutenue par un SRD spécifique peut être rendue sélectionnable, et sa sélection entraînerait la navigation vers un lien correspondant à ce SRD.
Ces portions liées aident les utilisateurs à identifier les parties du résumé qui sont vérifiables et à accéder facilement aux informations complémentaires. Les liens peuvent être des liens généraux vers les SRD ou des ancres spécifiques aux parties qui fournissent la vérification.
La détermination des parties liées se fait en comparant le contenu du résumé au contenu des SRD à l'aide de modèles d'encodage, identifiant ainsi les portions vérifiées. Cette fonctionnalité améliore la transparence et la fiabilité des résumés générés par l'IA.
Adaptation des stratégies SEO pour la SGE
L'intégration de l'IA dans les résultats de recherche implique une évolution nécessaire des stratégies SEO. Nous allons devoir nous concentrer sur la création de contenu complet, répondant aux questions principales des utilisateurs et optimisé pour les requêtes conversationnelles. La crédibilité et l'autorité du contenu deviennent primordiales, nécessitant des références fiables et une exactitude factuelle.