Lors du Google I/O 2024, Sundar Pichai a présenté des innovations marquantes, avec un focus sur l’intelligence artificielle, comme prévu. De l'intégration avancée de Gemini à l'amélioration des fonctionnalités de Google Search et Workspace, découvrez les différentes annonces du CEO de Google.

Ce qu'il faut retenir :

  • Google lance l'ère Gemini, un modèle d'intelligence artificielle conçu pour interagir de manière fluide et intuitive avec les utilisateurs ;
  • Les aperçus IA et Ask Photos transforment la manière dont les utilisateurs explorent et interagissent avec les informations et leurs souvenirs ; 
  • Les avancées techniques avec Gemini 1.5 Pro et l'introduction de Trillium, la sixième génération de TPU, marquent des progrès significatifs dans les capacités de développement et l'infrastructure nécessaire pour soutenir l'avenir de l'intelligence artificielle.

Résumé en 10 minutes du Google I/O 2024

Parce que le Google I/O a duré plusieurs heures et qu’il serait un peu difficile de vous convaincre de tout regarder, voici un résumé par Google des annonces les plus importantes : 

L'ère Gemini

Lors du dernier Google I/O, Gemini a été présenté. Aujourd’hui, les modèles Gemini sont les plus performants à ce jour, pour le texte, les images, les vidéos, le code, etc. Gemini 1.5 Pro, récemment déployé, est idéal pour les contextes longs et peut exécuter 1 million de tokens, plus que tout autre modèle. 

D’après Sundar Pichai, plus de 1,5 millions de développeurs utilisent Gemini au sein des outils Google, pour créer des applications IA ou débuguer du code. Gemini est de plus en plus intégré dans les différents produits Google pour les rendre plus efficaces, notamment dans le moteur de recherche, Photos, Workspace, Android… qui ont été abordés lors du Google I/O 2024.

Aperçus IA dans le moteur de recherche

Depuis un an également, Google a lancé la Search Generative Experience pour introduire de l’IA générative dans son moteur de recherche. Disponible en test via Search Labs, elle a permis de répondre à des milliards de requêtes. 

Si nous avons pu avoir des doutes sur un lancement plus global de la SGE, Sundar Pichai les a balayé lors de la conférence : “Je suis ravi d’annoncer que nous commencerons cette semaine à lancer cette expérience entièrement remaniée, AI Overviews, à tous les États-Unis. Et nous le proposerons bientôt à d’autres pays.

La SGE est donc bien lancée, sous le nom Aperçus IA, pour tous les américains. Les prochains pays à en bénéficier n’ont pas été cités, mais on imagine que cela concernera d’abord ceux qui utilisent déjà la SGE.

Ask Photos

Google Photos a été lancé il y a 9 ans, et représente plus de 6 milliards de photos et de vidéos mises en ligne chaque jour. Grâce à Gemini, Google lance la fonctionnalité Ask Photos, qui offre une interaction directe pour retrouver des informations précises. 

"Supposons que vous payiez à la station de stationnement, mais que vous ne vous souvenez pas de votre numéro de plaque d'immatriculation. Avant, vous pouviez rechercher des mots-clés dans Photos, puis faire défiler des années de photos à la recherche de plaques d’immatriculation. Désormais, vous pouvez simplement demander", a déclaré Sundar Pichai. Cette fonctionnalité rend la recherche de photos ou de souvenirs spécifiques non seulement possible mais aussi facile.

Ask Photos sera déployé cet été.

Améliorations et disponibilité de Gemini 1.5 Pro

Gemini 1.5 Pro est capable de traiter un million de tokens, soit de très longs contextes : des heures d’audio, des centaines de pages de texte, une heure de vidéo… Gemini 1.5 Pro a seulement été déployé avec sa fenêtre contextuelle à un millions de tokens à un groupe limité de développeurs et d’entreprises via Vertex AI et AI Studio, depuis février 2024. Pour les autres, la fenêtre contextuelle restait limitée à 128 000 tokens.

Grâce à ce groupe test, de nombreuses améliorations en matière de codage, de raisonnement et de traduction ont été apportées et sont visibles depuis hier dans le modèle, pour les développeurs du monde entier. 

Sundar Pichai a profité du Google I/O 2024 pour annoncer que Gemini 1.5 Pro et sa version à un million de tokens est désormais disponible pour tous dans Gemini Advanced, et ce dans 35 langues.

Mieux que ça, la fenêtre contextuelle est étendue à 2 millions de tokens, mais n’est disponible que pour les développeurs dans un aperçu privé pour le moment.

Intégrer Gemini 1.5 Pro à Workspace

Résumé de mails, analyse de pièces jointes, extraction de points clés d’une réunion sur Google Meet, rédaction de messages… Tout cela est désormais possible grâce à l’intégration de Gemini 1.5 Pro dans Google Workspace, dès à présent dans Workspace Labs.

Trillium

Trillium est la sixième génération de TPU (Tensor Processing Unit) développée par Google. Il s'agit d'un type de microprocesseur spécialement conçu pour accélérer les calculs nécessaires pour faire fonctionner les modèles d'intelligence artificielle. 

Trillium est conçu pour être plus performant et plus efficace énergétiquement que ses prédécesseurs, ce qui lui permet de traiter des tâches d'IA plus complexes et à plus grande échelle tout en consommant moins d'énergie.

"Trillium est notre TPU le plus performant et le plus efficace à ce jour, offrant une amélioration de 4,7 fois des performances de calcul par puce par rapport à la génération précédente, le TPU v5e", a souligné Pichai.

Trillium sera mis à disposition des clients Google Cloud fin 2024. 

Gemini sur Android

Sundar Pichai a également annoncé une plus grande intégration de Gemini sur Android, pour une meilleure expérience utilisateur. Gemini Nano, optimisé pour les appareils mobiles, est incorporé dans Android pour traiter le texte, les images, l’audio et la voix.