Google je najavio proširenje svoje inovativne značajke 'budžeta razmišljanja' na Gemini 2.5 Pro, najnapredniji AI model za zaključivanje ove kompanije, nakon uspješne implementacije u Gemini 2.5 Flash ranije ove godine.
Značajka budžeta razmišljanja predstavlja značajan napredak u upravljanju troškovima umjetne inteligencije, omogućujući developerima preciznu kontrolu nad količinom računalne snage koja se dodjeljuje za rješavanje složenih problema. Uz ovu mogućnost, korisnici mogu odrediti maksimalan broj tokena koje model koristi za interno zaključivanje prije generiranja odgovora ili čak potpuno isključiti mogućnosti razmišljanja za jednostavnije zadatke.
"Pokrenuli smo 2.5 Flash s budžetima razmišljanja kako bismo developerima dali veću kontrolu nad troškovima balansiranjem latencije i kvalitete. Sada tu mogućnost proširujemo i na 2.5 Pro," naveli su iz Googlea u svojoj objavi. Kompanija je potvrdila da će Gemini 2.5 Pro s budžetima biti općenito dostupan za stabilnu produkcijsku upotrebu u narednim tjednima.
Ovaj razvoj rješava temeljnu napetost na današnjem AI tržištu, gdje sofisticiranije zaključivanje obično povećava i latenciju i trošak. Primjerice, s Gemini 2.5 Flash, uključivanje zaključivanja povećava trošak izlaza gotovo šest puta – s 0,60 na 3,50 dolara po milijun tokena. Implementacijom budžeta razmišljanja, tvrtke mogu optimizirati svoje AI implementacije prema specifičnim slučajevima upotrebe, omogućujući zaključivanje samo kada je to potrebno.
Ova značajka posebno je vrijedna za poslovne korisnike koji moraju pažljivo upravljati troškovima implementacije AI-a, a pritom žele pristupiti naprednim mogućnostima. Za jednostavne upite poput prijevoda jezika ili osnovnog dohvaćanja informacija, razmišljanje se može isključiti radi maksimalne uštede. Za složene zadatke koji zahtijevaju višestupanjsko zaključivanje, poput rješavanja matematičkih problema ili detaljne analize, funkcija razmišljanja može se uključiti i precizno podesiti.
Kako umjetna inteligencija sve više postaje sastavni dio poslovnih procesa, Googleov pristup s prilagodljivim zaključivanjem odražava sazrijevanje tržišta na kojem optimizacija troškova i podešavanje performansi postaju jednako važni kao i same mogućnosti – što označava novu fazu u komercijalizaciji generativnih AI tehnologija.