Google a annoncé l’extension de sa fonctionnalité innovante de « budgets de réflexion » à Gemini 2.5 Pro, son modèle d’IA de raisonnement le plus avancé, après son déploiement réussi dans Gemini 2.5 Flash plus tôt cette année.
La fonctionnalité de budgets de réflexion représente une avancée majeure dans la gestion des coûts liés à l’IA, permettant aux développeurs de contrôler précisément la puissance de calcul allouée au raisonnement sur des problèmes complexes. Grâce à cette capacité, les utilisateurs peuvent spécifier le nombre maximal de jetons qu’un modèle utilise pour son raisonnement interne avant de générer une réponse, ou même désactiver complètement la réflexion pour les tâches plus simples.
« Nous avons lancé 2.5 Flash avec les budgets de réflexion afin de donner aux développeurs un meilleur contrôle des coûts en équilibrant latence et qualité. Et nous étendons cette capacité à 2.5 Pro », a déclaré Google dans son annonce. L’entreprise a confirmé que Gemini 2.5 Pro avec budgets sera généralement disponible pour une utilisation en production stable dans les prochaines semaines.
Ce développement répond à une tension fondamentale sur le marché actuel de l’IA, où un raisonnement plus sophistiqué entraîne généralement une augmentation de la latence et des coûts. Par exemple, avec Gemini 2.5 Flash, activer le raisonnement fait grimper les coûts de sortie d’environ six fois, passant de 0,60 $ à 3,50 $ par million de jetons. En mettant en œuvre des budgets de réflexion, les entreprises peuvent optimiser le déploiement de leur IA selon les cas d’utilisation, n’activant le raisonnement que lorsque cela est nécessaire.
La fonctionnalité est particulièrement précieuse pour les clients d’entreprise qui doivent gérer attentivement les coûts de déploiement de l’IA tout en accédant à des capacités avancées. Pour des requêtes simples comme la traduction de langue ou la recherche d’informations de base, la réflexion peut être désactivée pour une efficacité maximale des coûts. Pour des tâches complexes nécessitant un raisonnement en plusieurs étapes, comme la résolution de problèmes mathématiques ou l’analyse nuancée, la fonction de réflexion peut être activée et ajustée.
Alors que l’IA s’intègre de plus en plus aux processus d’affaires, l’approche de Google avec un raisonnement personnalisable reflète un marché en pleine maturité, où l’optimisation des coûts et l’ajustement de la performance deviennent aussi importants que les capacités brutes — annonçant une nouvelle phase dans la commercialisation des technologies d’IA générative.