menu
close

Google udvider AI-omkostningskontrol til Gemini 2.5 Pro

Google har udvidet sin 'tænkningsbudget'-funktion fra Gemini 2.5 Flash til Gemini 2.5 Pro, hvilket giver udviklere præcis kontrol over AI's ræsonnementomkostninger. Denne funktion gør det muligt for brugere at begrænse antallet af tokens, en model bruger på ræsonnement, eller helt deaktivere tænkning, hvilket balancerer ydeevne med økonomisk effektivitet. Funktionen adresserer en central udfordring for virksomheder, der implementerer avanceret AI i stor skala, da ræsonnement typisk medfører markant højere driftsomkostninger.
Google udvider AI-omkostningskontrol til Gemini 2.5 Pro

Google har annonceret, at deres innovative 'tænkningsbudget'-funktion nu udvides til Gemini 2.5 Pro, selskabets mest avancerede AI-ræsonnementmodel, efter en succesfuld implementering i Gemini 2.5 Flash tidligere på året.

Tænkningsbudgettet repræsenterer et markant fremskridt inden for styring af AI-omkostninger og giver udviklere mulighed for præcist at kontrollere, hvor meget computerkraft der tildeles til at løse komplekse problemer. Med denne funktion kan brugere angive det maksimale antal tokens, en model må bruge på intern tænkning, før den genererer et svar, eller endda helt deaktivere tænkning ved enklere opgaver.

"Vi lancerede 2.5 Flash med tænkningsbudgetter for at give udviklere mere kontrol over omkostninger ved at balancere latenstid og kvalitet. Og vi udvider nu denne funktion til 2.5 Pro," udtalte Google i deres meddelelse. Selskabet bekræftede, at Gemini 2.5 Pro med budgetter vil blive bredt tilgængelig til stabil produktion inden for de kommende uger.

Denne udvikling adresserer en grundlæggende udfordring på det nuværende AI-marked, hvor mere avanceret ræsonnement typisk øger både latenstid og omkostninger. For eksempel betyder aktivering af ræsonnement i Gemini 2.5 Flash, at outputomkostningerne næsten seksdobles – fra $0,60 til $3,50 pr. million tokens. Ved at implementere tænkningsbudgetter kan virksomheder optimere deres AI-udrulninger efter specifikke brugsscenarier og kun aktivere ræsonnement, når det er nødvendigt.

Funktionen er særligt værdifuld for erhvervskunder, der skal styre AI-omkostninger nøje, men stadig ønsker adgang til avancerede funktioner. Ved simple forespørgsler som sprogoversættelse eller basal informationssøgning kan tænkning deaktiveres for maksimal omkostningseffektivitet. Ved komplekse opgaver, der kræver flertrinsræsonnement, såsom matematisk problemløsning eller nuanceret analyse, kan tænkningsfunktionen aktiveres og finjusteres.

I takt med at AI i stigende grad bliver integreret i virksomheders arbejdsgange, afspejler Googles tilgang med tilpasningsdygtigt ræsonnement et modent marked, hvor omkostningsoptimering og performance-tuning bliver lige så vigtige som rå kapabiliteter – og markerer en ny fase i kommercialiseringen af generative AI-teknologier.

Source:

Latest News