menu
close

Google extinde controlul costurilor AI la Gemini 2.5 Pro

Google a extins funcția „thinking budgets” de la Gemini 2.5 Flash la Gemini 2.5 Pro, oferind dezvoltatorilor un control precis asupra costurilor de raționament AI. Această capabilitate permite utilizatorilor să limiteze numărul de token-uri folosite de model pentru raționament sau să dezactiveze complet funcția de gândire, echilibrând performanța cu eficiența economică. Funcția răspunde unei provocări critice pentru companiile care implementează AI avansat la scară largă, deoarece capabilitățile de raționament implică, de obicei, costuri operaționale semnificativ mai mari.
Google extinde controlul costurilor AI la Gemini 2.5 Pro

Google a anunțat extinderea funcției inovatoare „thinking budgets” la Gemini 2.5 Pro, cel mai avansat model AI de raționament al companiei, după implementarea cu succes a acesteia în Gemini 2.5 Flash la începutul acestui an.

Funcția „thinking budgets” reprezintă un progres semnificativ în gestionarea costurilor AI, permițând dezvoltatorilor să controleze cu precizie câtă putere de calcul este alocată raționamentului pentru probleme complexe. Prin această capabilitate, utilizatorii pot specifica numărul maxim de token-uri pe care modelul le folosește pentru raționament intern înainte de a genera un răspuns sau chiar pot dezactiva complet funcția de gândire pentru sarcini mai simple.

„Am lansat 2.5 Flash cu thinking budgets pentru a oferi dezvoltatorilor mai mult control asupra costurilor, echilibrând latența și calitatea. Iar acum extindem această capabilitate și la 2.5 Pro”, a declarat Google în anunțul său. Compania a confirmat că Gemini 2.5 Pro cu bugete va fi disponibil pentru utilizare stabilă în producție în următoarele săptămâni.

Această dezvoltare răspunde unei tensiuni fundamentale pe piața AI de astăzi, unde raționamentul mai sofisticat crește de obicei atât latența, cât și costurile. De exemplu, în cazul Gemini 2.5 Flash, activarea raționamentului crește costurile de output de aproape șase ori – de la 0,60 USD la 3,50 USD pe milion de token-uri. Prin implementarea thinking budgets, companiile își pot optimiza implementările AI în funcție de cazurile de utilizare specifice, activând raționamentul doar atunci când este necesar.

Funcția este deosebit de valoroasă pentru clienții enterprise care trebuie să gestioneze atent costurile de implementare AI, beneficiind totodată de capabilități avansate. Pentru interogări simple, precum traducerea limbii sau recuperarea de informații de bază, gândirea poate fi dezactivată pentru eficiență maximă a costurilor. Pentru sarcini complexe care necesită raționament în mai mulți pași, cum ar fi rezolvarea de probleme matematice sau analize nuanțate, funcția de gândire poate fi activată și ajustată fin.

Pe măsură ce AI devine tot mai integrat în fluxurile de lucru ale companiilor, abordarea Google cu raționament personalizabil reflectă o piață în maturizare, unde optimizarea costurilor și reglajul performanței devin la fel de importante ca și capabilitățile brute – semnalând o nouă etapă în comercializarea tehnologiilor AI generative.

Source:

Latest News