Google vient de dévoiler Gemini 2.5 Pro Experimental, sa nouvelle grande avancée dans le domaine de l'intelligence artificielle à ce jour. Ce modèle, conçu pour améliorer le raisonnement et la compréhension contextuelle, affiche des performances supérieures sur les benchmarks en mathématiques, sciences et codage. Disponible en version expérimentale sur Google AI Studio et dans l'application Gemini pour les utilisateurs avancés, il promet des capacités inédites.
Ce qu'il faut retenir :
- Gemini 2.5 Pro Experimental améliore le raisonnement et l'analyse des données complexes.
- Le nouveau modèle excelle dans la création d'applications et la transformation de code.
- Il comprend jusqu'à 1 million de tokens, avec une extension à 2 millions prévue.
- Google doit composer avec une concurrence accrue issue de DeepSeek et OpenAI.
Une intelligence artificielle qui « réfléchit »
Avec Gemini 2.5 Pro Experimental, Google DeepMind introduit un modèle conçu pour améliorer la capacité de raisonnement des IA. Cette intelligence artificielle ne se contente plus de classifier et prédire des résultats, elle analyse en profondeur les informations, tire des conclusions logiques et prend en compte le contexte. Cette approche repose sur des techniques comme le renforcement par apprentissage et la méthode du « chain-of-thought prompting », qui permet à l'IA de structurer sa pensée avant de fournir une réponse.
Google avait déjà amorcé ce tournant avec Gemini 2.0 et son modèle Flash Thinking. Aujourd'hui, Gemini 2.5 Pro pousse encore plus loin cette approche, notamment en améliorant son modèle de base et son post-entraînement.
Des performances supérieures en codage et en raisonnement
Gemini 2.5 Pro excelle sur plusieurs benchmarks de référence. Il surpasse les autres modèles dans les tests en mathématiques et sciences, notamment le GPQA et l'AIME 2025. Il atteint aussi un score record de 18,8 % sur Humanity's Last Exam, une base de données conçue pour évaluer les capacités de raisonnement des IA.
En codage, Gemini 2.5 Pro marque une évolution majeure par rapport à Gemini 2.0. Il est capable de créer des applications web complexes et des agents autonomes. Sur le benchmark SWE-Bench Verified, référence pour l'évaluation des IA en programmation, il atteint un score impressionnant de 63,8 %. Un exemple marquant est sa capacité à générer le code exécutable d'un jeu vidéo à partir d'un simple prompt en une ligne.
Un contexte étendu pour une meilleure compréhension
L'une des grandes forces de Gemini 2.5 Pro réside dans sa fenêtre de contexte. Il peut traiter jusqu'à 1 million de tokens dès sa sortie, avec une extension à 2 millions prévue prochainement. Cette capacité lui permet d'intégrer de grandes quantités de données issues de sources variées : texte, audio, images, vidéo, et même des dépôts de code entiers.
Cette avancée rend Gemini 2.5 Pro particulièrement utile pour les développeurs et les entreprises traitant des ensembles de données volumineux. Il peut analyser des bases de code complexes et répondre avec précision à des problématiques avancées.
Une concurrence accrue sur le marché de l'IA
Le lancement de Gemini 2.5 Pro s'inscrit dans un contexte de compétition intense entre les modèles d'intelligence artificielle. Depuis le déploiement de Gemini 2.0 en décembre, de nouveaux acteurs ont bouleversé le paysage. DeepSeek, avec son modèle DeepSeek-R1, a démontré qu'il était possible d'obtenir des performances élevées avec un coût d'entraînement réduit. Ce modèle open source rivalise avec des solutions fermées comme celles d'OpenAI, qui prépare également de nouveaux modèles de raisonnement.
Google a aussi dévoilé ce mois-ci Gemma 3, une version améliorée de son petit modèle de langage, optimisé pour les appareils mobiles et offrant une fenêtre de contexte de 128 000 tokens.
Avec Gemini 2.5 Pro, Google réaffirme donc son ambition de dominer le marché des IA avancées, tout en préparant l'avenir avec des modèles encore plus puissants. Le modèle est déjà disponible en version expérimentale sur Google AI Studio et dans l'application Gemini, et sera prochainement intégré à Vertex AI.