Google a anunțat extinderea funcției inovatoare „thinking budgets” la Gemini 2.5 Pro, cel mai avansat model AI de raționament al companiei, după implementarea cu succes a acesteia în Gemini 2.5 Flash la începutul acestui an.
Funcția „thinking budgets” reprezintă un progres semnificativ în gestionarea costurilor AI, permițând dezvoltatorilor să controleze cu precizie câtă putere de calcul este alocată raționamentului pentru probleme complexe. Prin această capabilitate, utilizatorii pot specifica numărul maxim de token-uri pe care modelul le folosește pentru raționament intern înainte de a genera un răspuns sau chiar pot dezactiva complet funcția de gândire pentru sarcini mai simple.
„Am lansat 2.5 Flash cu thinking budgets pentru a oferi dezvoltatorilor mai mult control asupra costurilor, echilibrând latența și calitatea. Iar acum extindem această capabilitate și la 2.5 Pro”, a declarat Google în anunțul său. Compania a confirmat că Gemini 2.5 Pro cu bugete va fi disponibil pentru utilizare stabilă în producție în următoarele săptămâni.
Această dezvoltare răspunde unei tensiuni fundamentale pe piața AI de astăzi, unde raționamentul mai sofisticat crește de obicei atât latența, cât și costurile. De exemplu, în cazul Gemini 2.5 Flash, activarea raționamentului crește costurile de output de aproape șase ori – de la 0,60 USD la 3,50 USD pe milion de token-uri. Prin implementarea thinking budgets, companiile își pot optimiza implementările AI în funcție de cazurile de utilizare specifice, activând raționamentul doar atunci când este necesar.
Funcția este deosebit de valoroasă pentru clienții enterprise care trebuie să gestioneze atent costurile de implementare AI, beneficiind totodată de capabilități avansate. Pentru interogări simple, precum traducerea limbii sau recuperarea de informații de bază, gândirea poate fi dezactivată pentru eficiență maximă a costurilor. Pentru sarcini complexe care necesită raționament în mai mulți pași, cum ar fi rezolvarea de probleme matematice sau analize nuanțate, funcția de gândire poate fi activată și ajustată fin.
Pe măsură ce AI devine tot mai integrat în fluxurile de lucru ale companiilor, abordarea Google cu raționament personalizabil reflectă o piață în maturizare, unde optimizarea costurilor și reglajul performanței devin la fel de importante ca și capabilitățile brute – semnalând o nouă etapă în comercializarea tehnologiilor AI generative.