Découvrez la nouvelle IA open source de Google, adaptée aux ordinateurs portables : Gemma. Basée sur la technologie Gemini (on ne s’en serait pas doutés, vu son nom), elle peut être utilisée pour créer des chatbots et des outils de génération de contenu.
Ce qu'il faut retenir :
- Google présente Gemma, un LLM open source, léger et puissant, basé sur la technologie des modèles Gemini ;
- Avec des versions de 2B et 7B, Gemma est optimisé pour fonctionner sur des ordinateurs portables et dans le cloud, rendant l'IA de pointe accessible à tous ;
- Gemma intègre des outils et des méthodologies pour garantir une utilisation sûre et responsable, y compris un nouveau kit d'IA générative responsable.
Lancement de Gemma par Google
Google annonce le lancement de Gemma, un LLM open source optimisé pour être utilisé dans des environnements aux ressources limitées type ordinateurs portables ou infrastructures cloud. Il peut être utilisé autant pour concevoir des chatbots que des outils de génération de contenu.
Gemma est le fruit du travail de Google DeepMind et d'autres équipes de Google. Il est disponible en 2 versions : Gemma 2B (2 milliards de paramètres) et Gemma 7B (7 milliards), chacune disponible en variantes pré-entraînées et ajustées par instruction. Les modèles avec plus de paramètres disposent d’une meilleure compréhension du langage et pourront générer des réponses plus fiables, mais consomment plus de ressources.
L’objectif de Gemma est de démocratiser l’accès à une IA de pointe, formée pour être sécurisée et responsable.
Un fonctionnement efficace sur ordinateur portable
Gemma se distingue par sa capacité à fonctionner efficacement sur des ordinateurs portables ou dans le cloud, avec un déploiement facile sur Vertex AI et GKE (Google Kubernetes Engine). Ses performances sont garanties grâce à une optimisation sur diverses plateformes matérielles, y compris les GPU NVIDIA et les TPU Google Cloud.
Les modèles Gemma, avec leur vocabulaire étendu de 250 000 tokens (contre 32 000 pour des modèles comparables) et des poids d'incrustation significatifs, sont conçus pour traiter une grande variété de tâches, y compris la génération de contenu, la création de chatbots et bien plus encore.
La sécurité au premier plan
Gemma a été développé avec un accent particulier sur la sécurité et la responsabilité, ce qui le rend facilement déployable. Google a mis en place des techniques automatisées pour filtrer les informations personnelles et sensibles des ensembles de données d'entraînement.
Un apprentissage par renforcement à partir de retours humains (RLHF) a été utilisé pour aligner les modèles sur des comportements responsables. Un nouveau kit d'IA générative responsable accompagne Gemma, pour aider les développeurs à créer des applications IA sûres et responsables. Le kit comprend :
- une nouvelle méthodologie pour créer des classificateurs de sécurité robustes ;
- un outil de débogage de modèle pour étudier le comportement de Gemma et résoudre les problèmes potentiels ;
- des bonnes pratiques destinées aux créateurs de modèles.
Support pour les développeurs
Gemma est accompagné d'une suite d'outils et de ressources pour soutenir l'innovation des développeurs, y compris des notebooks Colab et Kaggle prêts à l'emploi, ainsi qu'une intégration avec des outils populaires tels que Hugging Face, MaxText, NVIDIA NeMo et TensorRT-LLM.
Gemma est accessible dès aujourd’hui. Vous pouvez bénéficier d’un accès gratuit à Kaggle et aux notebooks Colab, ou d’un crédit de 300$ pour les nouveaux utilisateurs de Google Cloud. Les chercheurs peuvent demander des crédits Google Cloud jusqu’à 500 000$ pour accélérer leurs projets.