Google étend les contrôles de coûts liés à l’IA à Gemini 2.5 Pro

Google a élargi sa fonctionnalité de « budgets de réflexion » de Gemini 2.5 Flash à Gemini 2.5 Pro, offrant ainsi aux développeurs un contrôle précis sur les coûts de raisonnement de l’IA. Cette capacité permet aux utilisateurs de limiter le nombre de jetons qu’un modèle utilise pour le raisonnement ou de désactiver complètement la réflexion, équilibrant ainsi performance et efficacité économique. Cette fonctionnalité répond à un enjeu crucial pour les entreprises qui déploient l’IA avancée à grande échelle, puisque les capacités de raisonnement entraînent généralement des coûts d’exploitation nettement plus élevés.

Google a annoncé l’extension de sa fonctionnalité innovante de « budgets de réflexion » à Gemini 2.5 Pro, son modèle d’IA de raisonnement le plus avancé, après son déploiement réussi dans Gemini 2.5 Flash plus tôt cette année.

La fonctionnalité de budgets de réflexion représente une avancée majeure dans la gestion des coûts liés à l’IA, permettant aux développeurs de contrôler précisément la puissance de calcul allouée au raisonnement sur des problèmes complexes. Grâce à cette capacité, les utilisateurs peuvent spécifier le nombre maximal de jetons qu’un modèle utilise pour son raisonnement interne avant de générer une réponse, ou même désactiver complètement la réflexion pour les tâches plus simples.

« Nous avons lancé 2.5 Flash avec les budgets de réflexion afin de donner aux développeurs un meilleur contrôle des coûts en équilibrant latence et qualité. Et nous étendons cette capacité à 2.5 Pro », a déclaré Google dans son annonce. L’entreprise a confirmé que Gemini 2.5 Pro avec budgets sera généralement disponible pour une utilisation en production stable dans les prochaines semaines.

Ce développement répond à une tension fondamentale sur le marché actuel de l’IA, où un raisonnement plus sophistiqué entraîne généralement une augmentation de la latence et des coûts. Par exemple, avec Gemini 2.5 Flash, activer le raisonnement fait grimper les coûts de sortie d’environ six fois, passant de 0,60 $ à 3,50 $ par million de jetons. En mettant en œuvre des budgets de réflexion, les entreprises peuvent optimiser le déploiement de leur IA selon les cas d’utilisation, n’activant le raisonnement que lorsque cela est nécessaire.

La fonctionnalité est particulièrement précieuse pour les clients d’entreprise qui doivent gérer attentivement les coûts de déploiement de l’IA tout en accédant à des capacités avancées. Pour des requêtes simples comme la traduction de langue ou la recherche d’informations de base, la réflexion peut être désactivée pour une efficacité maximale des coûts. Pour des tâches complexes nécessitant un raisonnement en plusieurs étapes, comme la résolution de problèmes mathématiques ou l’analyse nuancée, la fonction de réflexion peut être activée et ajustée.

Alors que l’IA s’intègre de plus en plus aux processus d’affaires, l’approche de Google avec un raisonnement personnalisable reflète un marché en pleine maturité, où l’optimisation des coûts et l’ajustement de la performance deviennent aussi importants que les capacités brutes — annonçant une nouvelle phase dans la commercialisation des technologies d’IA générative.

Source:

Google étend les contrôles de coûts liés à l’IA à Gemini 2.5 Pro

Latest News

L’IA Doubao de ByteDance offre désormais une assistance vidéo en temps réel

OnePlus abandonne le curseur d’alerte au profit de la touche Plus propulsée par l’IA

Les géants allemands de la tech s’unissent pour une gigafactory d’IA soutenue par l’UE

Les procureurs américains ont enquêté sur Builder.ai avant l’effondrement de la startup d’IA évaluée à 1,5 G$

Le fonds souverain de 1,8 billion $ de la Norvège rend l’IA incontournable pour son personnel

OpenTools.ai dévoile un centre de nouvelles sur l’IA pour les professionnels de la technologie

Google ouvre le contrôle informatique par IA aux développeurs via Gemini

Google améliore les modèles Gemini avec des résumés transparents de la réflexion

Google étend les contrôles de coûts liés à l’IA à Gemini 2.5 Pro

Related Articles

OnePlus abandonne le curseur d’alerte au profit de la touche Plus propulsée par l’IA

Les géants allemands de la tech s’unissent pour une gigafactory d’IA soutenue par l’UE

Les procureurs américains ont enquêté sur Builder.ai avant l’effondrement de la startup d’IA évaluée à 1,5 G$

Latest News

L’IA Doubao de ByteDance offre désormais une assistance vidéo en temps réel

OnePlus abandonne le curseur d’alerte au profit de la touche Plus propulsée par l’IA

Les géants allemands de la tech s’unissent pour une gigafactory d’IA soutenue par l’UE

Les procureurs américains ont enquêté sur Builder.ai avant l’effondrement de la startup d’IA évaluée à 1,5 G$

Le fonds souverain de 1,8 billion $ de la Norvège rend l’IA incontournable pour son personnel

OpenTools.ai dévoile un centre de nouvelles sur l’IA pour les professionnels de la technologie

Google ouvre le contrôle informatique par IA aux développeurs via Gemini

Google améliore les modèles Gemini avec des résumés transparents de la réflexion