Google a annoncé une avancée majeure pour son modèle d’IA phare avec l’introduction du mode Deep Think pour Gemini 2.5 Pro, représentant un bond important dans les capacités de raisonnement de l’intelligence artificielle.
Deep Think s’appuie sur des recherches de pointe en techniques de pensée parallèle, permettant au modèle d’explorer et d’évaluer simultanément plusieurs solutions potentielles avant de fournir une réponse. Cette approche reflète la façon dont les experts humains abordent les problèmes complexes en considérant divers angles et hypothèses.
« Il utilise nos recherches les plus récentes en matière de raisonnement – y compris des techniques de pensée parallèle – ce qui se traduit par des performances incroyables », a expliqué Demis Hassabis, PDG de Google DeepMind, lors de l’annonce à Google I/O 2025.
Le nouveau mode a démontré des résultats exceptionnels sur des tests particulièrement exigeants. Il a obtenu un score impressionnant à l’Olympiade mathématique des États-Unis 2025 (USAMO), largement considérée comme l’une des évaluations mathématiques les plus difficiles. Deep Think arrive aussi en tête sur LiveCodeBench, un test exigeant pour la programmation de compétition, et a obtenu un score de 84 % sur MMMU, qui évalue le raisonnement multimodal à travers diverses tâches.
Au-delà de Deep Think, Google a considérablement renforcé la sécurité de la famille Gemini 2.5. L’entreprise a mis en place des mesures avancées contre les attaques indirectes par injection d’instructions, où des instructions malveillantes sont intégrées dans les données récupérées par le modèle d’IA. Selon Google, leur nouvelle approche de sécurité a considérablement augmenté le taux de protection de Gemini contre ce type d’attaques lors de l’utilisation d’outils, faisant de la série 2.5 la famille de modèles la plus sécuritaire de Google à ce jour.
Google adopte une approche prudente pour le déploiement de Deep Think. « Parce que nous repoussons les limites avec 2.5 Pro DeepThink, nous prenons plus de temps pour effectuer des évaluations de sécurité approfondies et obtenir davantage de retours d’experts en sécurité », a indiqué l’entreprise. Dans un premier temps, Deep Think sera offert uniquement à des testeurs de confiance via l’API Gemini afin de recueillir des commentaires avant un déploiement plus large.
L’entreprise a également annoncé des améliorations à Gemini 2.5 Flash, son modèle plus efficace conçu pour la rapidité et les faibles coûts. La version mise à jour utilise 20 à 30 % moins de jetons tout en offrant de meilleures performances en matière de raisonnement, de multimodalité, de code et sur des tests de contexte étendu.