Google renforce son offre en intelligence artificielle en élargissant la famille de modèles Gemini 2.5 avec l’introduction de Gemini 2.5 Flash-Lite, son modèle le plus économique et rapide de la gamme 2.5.
Annoncé le 2 juillet 2025, Flash-Lite rejoint les modèles Gemini 2.5 Flash et Pro, désormais généralement disponibles, complétant ainsi une approche à trois niveaux pour répondre à différents besoins d’applications en IA. Flash-Lite est spécialement conçu pour les tâches à grand volume et sensibles à la latence, comme la traduction et la classification, avec des tests de performance démontrant une latence inférieure aux précédents modèles Flash.
Malgré son optimisation pour la vitesse et le coût, Flash-Lite conserve les principales capacités de la famille Gemini 2.5, incluant une fenêtre de contexte d’un million de jetons, la prise en charge de l’entrée multimodale et la compatibilité avec des outils comme Google Search et l’exécution de code. Contrairement à ses homologues, Flash-Lite désactive par défaut les capacités de raisonnement pour maximiser l’efficacité, bien que les utilisateurs puissent activer cette fonctionnalité au besoin.
Parallèlement à cette expansion de modèles, Google a présenté Gemini CLI, un agent IA open source qui intègre Gemini directement dans les terminaux des développeurs. Distribué sous licence Apache 2.0, cet outil offre un accès léger à Gemini pour la programmation, la création de contenu, la résolution de problèmes et la gestion de tâches. Les développeurs peuvent accéder gratuitement à Gemini 2.5 Pro avec un compte Google personnel, bénéficiant de limites généreuses de 60 requêtes par minute et 1 000 requêtes par jour.
L’outil CLI prend en charge une personnalisation poussée grâce aux invites système et aux paramètres de configuration, le rendant adaptable à divers flux de travail. Il s’intègre également à l’assistant de codage IA de Google, Gemini Code Assist, offrant une expérience unifiée à travers différents environnements de développement.
Ces nouveautés reflètent la stratégie de Google visant à rendre l’IA avancée plus accessible tout en proposant des options adaptées à des exigences spécifiques de performance et de coût. La famille Gemini 2.5 propose désormais un éventail complet, du modèle Pro haute performance pour les tâches complexes au modèle Flash-Lite économique pour les applications à haut débit.