Google a annoncé une avancée majeure pour son modèle d’IA phare avec l’introduction du mode Deep Think pour Gemini 2.5 Pro, marquant un bond significatif dans les capacités de raisonnement de l’intelligence artificielle.
Deep Think s’appuie sur des recherches de pointe en techniques de pensée parallèle, permettant au modèle d’explorer et d’évaluer simultanément plusieurs solutions potentielles avant de formuler une réponse. Cette approche s’inspire de la manière dont les experts humains abordent les problèmes complexes en considérant divers angles et hypothèses.
« Cela utilise nos recherches les plus avancées en matière de raisonnement – y compris les techniques de pensée parallèle – ce qui se traduit par des performances incroyables », a expliqué Demis Hassabis, PDG de Google DeepMind, lors de l’annonce à Google I/O 2025.
Le nouveau mode a démontré des résultats exceptionnels sur des benchmarks exigeants. Il a obtenu un score impressionnant à l’Olympiade Mathématique des États-Unis 2025 (USAMO), largement considérée comme l’un des tests mathématiques les plus difficiles. Deep Think est également en tête sur LiveCodeBench, un benchmark ardu pour la programmation de compétition, et a atteint 84 % sur MMMU, qui évalue le raisonnement multimodal sur des tâches variées.
Au-delà de Deep Think, Google a considérablement renforcé la sécurité de la famille Gemini 2.5. L’entreprise a mis en place des protections avancées contre les attaques d’injection indirecte de prompts – où des instructions malveillantes sont dissimulées dans les données récupérées par le modèle d’IA. Selon Google, cette nouvelle approche de sécurité a nettement augmenté le taux de protection de Gemini contre ce type d’attaques lors de l’utilisation d’outils, faisant de la série 2.5 la famille de modèles la plus sécurisée de Google à ce jour.
Google adopte une approche prudente pour le déploiement de Deep Think. « Parce que nous repoussons les frontières avec 2.5 Pro DeepThink, nous prenons plus de temps pour effectuer davantage d’évaluations de sécurité avancées et recueillir l’avis d’experts en sécurité », a indiqué l’entreprise. Dans un premier temps, Deep Think ne sera accessible qu’à des testeurs de confiance via l’API Gemini afin de recueillir des retours avant un déploiement plus large.
L’entreprise a également annoncé des améliorations pour Gemini 2.5 Flash, son modèle plus efficace conçu pour la rapidité et la réduction des coûts. La version mise à jour utilise 20 à 30 % de tokens en moins tout en offrant de meilleures performances sur les benchmarks de raisonnement, de multimodalité, de code et de contexte long.