Moins de 24 heures après le lancement de Google Gemini, des conversations chat étaient visibles dans les résultats de recherche de Google, pour une raison surprenante !
Ce qu'il faut retenir :
- Google a rapidement réagi à ce qui semblait être une fuite, avec les conversations chat de Gemini disparaissant progressivement des résultats de recherche ;
- Les utilisateurs peuvent créer des liens vers une version publiquement consultable de chats privés, mais un lien public a permis leur indexation dans les SERP.
Fuites de Gemini : un malentendu ?
Le lancement de Google Gemini a été rapidement marqué par la découverte de conversations accessibles publiquement via les résultats de recherche de Google.
Cette situation, initialement perçue comme une fuite de données, s'est avérée être le résultat d'une fonctionnalité permettant aux utilisateurs de créer des liens vers des versions publiques de chats privés. La réaction rapide de Google a permis de diminuer considérablement la présence de ces conversations dans les SERP en quelques heures.
Cette publication de discussions privées n’est pas sans rappeler l’effervescence autour de la fuite des conversations sur Google Bard, survenue fin septembre. Cette indexation était involontaire et Google a fait en sorte de désindexer toutes les conversations Bard. Ils étaient donc au point pour supprimer rapidement les conversations Gemini !
Aujourd’hui, le problème semble complètement réglé. A l’heure où je vous écris, il n’y a plus qu’une discussion divulguée présente dans les SERP :
Comment les chats de Gemini ont-ils été créés et indexés ?
Contrairement à ce que l'on pourrait croire du fait de la publication rapide de ces conversations, Google ne crée pas automatiquement des pages web à partir de chats privés.
C'est l'action des utilisateurs, via un lien situé au bas de chaque chat, qui génère ces pages partageables. La première hypothèse a été de penser à un oubli de Google de placer un fichier robots.txt dans le sous-domaine de Gemini, permettant ainsi leur crawl et indexation.
Pourtant, le fichier était bien présent depuis le lancement de Gemini, avec “disallow: /share/”, ce qui en toute logique aurait dû empêcher l’indexation des conversations, même partagées.
Quelle est la vraie raison de cette indexation ?
Il se trouve qu’un lien public vers une des conversations partagées existe :
Ainsi, même si les conversations sont bloquées dans le fichier robots.txt, le fait qu’il existe un lien vers une de ces URL dans un commentaire de blog a rendu possible son indexation. Donc… même si votre fichier robots.txt bloque l’exploration de certaines URL, s’il existe un lien public vers elles, elles seront quand même indexées. Selon Bill Hartzer, Google aurait dû autoriser l’exploration du fichier robots.txt et ajouter une balise méta noindex sur les pages, comme le moteur de recherche le recommande.
Pourquoi les pages ont-elles disparu des SERP ?
La disparition progressive des pages chat de Gemini des résultats de recherche de Google et Bing pourrait s'expliquer par la mise en place d'une règle interne excluant ces pages de l'index, malgré leur lien public.
De plus, ce sont des pages qui ne valent pas vraiment la peine d’être affichées dans les SERP, n’étant pas de “bonne qualité” d’après les critères des moteurs de recherche.
Toutefois, ce n'est pas parce que vos conversations ne sont plus visibles sur les SERP qu'elles ne sont pas "consultables". Google recommande aux utilisateurs de Gemini de ne jamais partager de données confidentielles, car elles peuvent être examinées par des humains et utilisées pour entraîner l'intelligence artificielle.