Google a officiellement lancé Gemini 2.5 Flash pour tous les utilisateurs, marquant une avancée significative tant au niveau des capacités de l’IA que des fonctionnalités de sécurité.
La nouvelle version, désormais disponible dans l’application Gemini, apporte des améliorations majeures sur plusieurs plans. Selon Demis Hassabis, directeur de Google DeepMind, Gemini 2.5 Flash est « meilleur sur presque tous les plans », avec des performances accrues en raisonnement, multimodalité, code et sur les benchmarks de contexte long. Plus impressionnant encore, ces progrès sont réalisés avec une efficacité supérieure de 22 %, le modèle utilisant moins de tokens pour générer des réponses similaires.
La sécurité a été un axe majeur de cette mise à jour. Google a mis en œuvre des mesures de protection avancées qui renforcent considérablement la défense de Gemini contre les attaques indirectes par injection de prompt lors de l’utilisation d’outils. Ces attaques surviennent lorsque des instructions malveillantes sont dissimulées dans des données récupérées par le modèle d’IA. Grâce à une combinaison de renforcement du modèle, de contrôles des entrées/sorties et de garde-fous au niveau système, Google fait de Gemini 2.5 sa famille de modèles la plus sécurisée à ce jour.
Les développeurs pourront accéder à cette version mise à jour dans Google AI Studio et les entreprises via Vertex AI dès début juin, Gemini 2.5 Pro arrivant peu après. La sortie inclut de nouvelles fonctionnalités destinées aux développeurs, telles que les « résumés de réflexion » qui structurent le processus de raisonnement du modèle en un format organisé avec des titres et des points clés, facilitant ainsi la compréhension et le débogage des interactions.
Gemini 2.5 Pro sera enrichi de Deep Think, un mode de raisonnement expérimental spécialement conçu pour les tâches mathématiques et de programmation très complexes. Cette fonctionnalité permet au modèle de considérer plusieurs hypothèses avant de répondre, ce qui se traduit par des scores impressionnants sur des benchmarks exigeants comme l’USAMO 2025 en mathématiques et LiveCodeBench pour le codage compétitif.
La famille Gemini 2.5 introduit également de nouvelles capacités audio, dont la synthèse vocale native avec prise en charge de plusieurs locuteurs dans 24 langues. Les utilisateurs peuvent personnaliser le ton, l’accent et le style d’élocution de l’IA, le modèle étant capable de détecter l’émotion dans la voix de l’utilisateur et d’y répondre de manière appropriée.
Avec ces améliorations, Google continue de positionner Gemini comme une plateforme d’IA de premier plan pour les particuliers comme pour les entreprises, alliant capacités avancées et mesures de sécurité renforcées.