Google oznámil rozšíření své inovativní funkce 'rozpočty na přemýšlení' i na Gemini 2.5 Pro, svůj nejpokročilejší model pro AI uvažování, a to po úspěšném nasazení této funkce v Gemini 2.5 Flash začátkem letošního roku.
Funkce rozpočtů na přemýšlení představuje významný pokrok v řízení nákladů na AI, protože vývojářům umožňuje přesně nastavit, kolik výpočetního výkonu bude věnováno řešení složitých problémů. Uživatelé tak mohou určit maximální počet tokenů, které model využije pro interní uvažování před vygenerováním odpovědi, nebo mohou tuto schopnost pro jednodušší úlohy zcela vypnout.
"Spustili jsme 2.5 Flash s rozpočty na přemýšlení, abychom vývojářům dali větší kontrolu nad náklady díky vyvážení latence a kvality. A tuto možnost nyní rozšiřujeme i na 2.5 Pro," uvedl Google ve svém oznámení. Společnost potvrdila, že Gemini 2.5 Pro s rozpočty bude během několika týdnů obecně dostupný pro stabilní produkční použití.
Tento krok řeší zásadní napětí na dnešním trhu s AI, kde sofistikovanější uvažování obvykle znamená vyšší latenci i náklady. Například u Gemini 2.5 Flash aktivace uvažování zvýší náklady na výstup téměř šestinásobně – z 0,60 USD na 3,50 USD za milion tokenů. Díky rozpočtům na přemýšlení mohou firmy optimalizovat nasazení AI podle konkrétních scénářů a povolit uvažování jen tehdy, kdy je to nezbytné.
Funkce je zvláště cenná pro firemní zákazníky, kteří potřebují pečlivě řídit náklady na AI a zároveň využívat pokročilé schopnosti. U jednoduchých dotazů, jako je překlad nebo základní vyhledávání informací, lze uvažování vypnout pro maximální úsporu. U složitějších úloh, které vyžadují vícekrokové uvažování – například matematické řešení nebo detailní analýzu – lze tuto funkci povolit a jemně nastavit.
Jak se AI stále více začleňuje do firemních procesů, přístup Googlu s možností přizpůsobení uvažování odráží vyspívající trh, kde je optimalizace nákladů a ladění výkonu stejně důležité jako samotné schopnosti – což značí novou fázi komercializace generativních AI technologií.