menu
close

Google étend les contrôles de coûts liés à l’IA à Gemini 2.5 Pro

Google a élargi sa fonctionnalité de « budgets de réflexion » de Gemini 2.5 Flash à Gemini 2.5 Pro, offrant ainsi aux développeurs un contrôle précis sur les coûts de raisonnement de l’IA. Cette capacité permet aux utilisateurs de limiter le nombre de jetons qu’un modèle utilise pour le raisonnement ou de désactiver complètement la réflexion, équilibrant ainsi performance et efficacité économique. Cette fonctionnalité répond à un enjeu crucial pour les entreprises qui déploient l’IA avancée à grande échelle, puisque les capacités de raisonnement entraînent généralement des coûts d’exploitation nettement plus élevés.
Google étend les contrôles de coûts liés à l’IA à Gemini 2.5 Pro

Google a annoncé l’extension de sa fonctionnalité innovante de « budgets de réflexion » à Gemini 2.5 Pro, son modèle d’IA de raisonnement le plus avancé, après son déploiement réussi dans Gemini 2.5 Flash plus tôt cette année.

La fonctionnalité de budgets de réflexion représente une avancée majeure dans la gestion des coûts liés à l’IA, permettant aux développeurs de contrôler précisément la puissance de calcul allouée au raisonnement sur des problèmes complexes. Grâce à cette capacité, les utilisateurs peuvent spécifier le nombre maximal de jetons qu’un modèle utilise pour son raisonnement interne avant de générer une réponse, ou même désactiver complètement la réflexion pour les tâches plus simples.

« Nous avons lancé 2.5 Flash avec les budgets de réflexion afin de donner aux développeurs un meilleur contrôle des coûts en équilibrant latence et qualité. Et nous étendons cette capacité à 2.5 Pro », a déclaré Google dans son annonce. L’entreprise a confirmé que Gemini 2.5 Pro avec budgets sera généralement disponible pour une utilisation en production stable dans les prochaines semaines.

Ce développement répond à une tension fondamentale sur le marché actuel de l’IA, où un raisonnement plus sophistiqué entraîne généralement une augmentation de la latence et des coûts. Par exemple, avec Gemini 2.5 Flash, activer le raisonnement fait grimper les coûts de sortie d’environ six fois, passant de 0,60 $ à 3,50 $ par million de jetons. En mettant en œuvre des budgets de réflexion, les entreprises peuvent optimiser le déploiement de leur IA selon les cas d’utilisation, n’activant le raisonnement que lorsque cela est nécessaire.

La fonctionnalité est particulièrement précieuse pour les clients d’entreprise qui doivent gérer attentivement les coûts de déploiement de l’IA tout en accédant à des capacités avancées. Pour des requêtes simples comme la traduction de langue ou la recherche d’informations de base, la réflexion peut être désactivée pour une efficacité maximale des coûts. Pour des tâches complexes nécessitant un raisonnement en plusieurs étapes, comme la résolution de problèmes mathématiques ou l’analyse nuancée, la fonction de réflexion peut être activée et ajustée.

Alors que l’IA s’intègre de plus en plus aux processus d’affaires, l’approche de Google avec un raisonnement personnalisable reflète un marché en pleine maturité, où l’optimisation des coûts et l’ajustement de la performance deviennent aussi importants que les capacités brutes — annonçant une nouvelle phase dans la commercialisation des technologies d’IA générative.

Source:

Latest News