menu
close

Google rozširuje kontrolu nákladov na AI aj do Gemini 2.5 Pro

Google rozšíril funkciu 'rozpočty na premýšľanie' z Gemini 2.5 Flash aj do Gemini 2.5 Pro, čím vývojárom poskytuje presnú kontrolu nad nákladmi na AI uvažovanie. Táto možnosť umožňuje používateľom obmedziť počet tokenov, ktoré model využíva na uvažovanie, alebo premýšľanie úplne vypnúť, čím sa dosahuje rovnováha medzi výkonom a ekonomickou efektivitou. Funkcia rieši zásadnú výzvu pre firmy nasadzujúce pokročilú AI vo veľkom rozsahu, keďže schopnosti uvažovania zvyčajne znamenajú výrazne vyššie prevádzkové náklady.
Google rozširuje kontrolu nákladov na AI aj do Gemini 2.5 Pro

Spoločnosť Google oznámila rozšírenie svojej inovatívnej funkcie 'rozpočty na premýšľanie' aj do Gemini 2.5 Pro, svojho najpokročilejšieho modelu na AI uvažovanie, po úspešnom nasadení tejto funkcie v Gemini 2.5 Flash začiatkom tohto roka.

Rozpočty na premýšľanie predstavujú významný pokrok v riadení nákladov na AI, keďže vývojárom umožňujú presne kontrolovať, koľko výpočtového výkonu sa pridelí na riešenie zložitých problémov. Používatelia môžu určiť maximálny počet tokenov, ktoré model využije na interné uvažovanie pred vygenerovaním odpovede, alebo môžu možnosť premýšľania pre jednoduchšie úlohy úplne vypnúť.

„Spustili sme 2.5 Flash s rozpočtami na premýšľanie, aby sme vývojárom dali väčšiu kontrolu nad nákladmi vyvážením latencie a kvality. A túto možnosť teraz rozširujeme aj do 2.5 Pro,“ uviedol Google vo svojom oznámení. Spoločnosť potvrdila, že Gemini 2.5 Pro s rozpočtami bude v najbližších týždňoch všeobecne dostupný na stabilné produkčné použitie.

Tento krok rieši základné napätie na dnešnom AI trhu, kde sofistikovanejšie uvažovanie zvyčajne zvyšuje latenciu aj náklady. Napríklad pri Gemini 2.5 Flash zapnutie uvažovania zvýši výstupné náklady takmer šesťnásobne – z 0,60 USD na 3,50 USD za milión tokenov. Zavedením rozpočtov na premýšľanie môžu firmy optimalizovať nasadenie AI podľa konkrétnych prípadov použitia a zapínať uvažovanie len vtedy, keď je to potrebné.

Funkcia je obzvlášť cenná pre firemných zákazníkov, ktorí potrebujú starostlivo riadiť náklady na AI a zároveň využívať pokročilé možnosti. Pri jednoduchých dopytoch, ako je preklad jazyka alebo základné vyhľadávanie informácií, je možné premýšľanie vypnúť pre maximálnu úsporu. Pri zložitých úlohách vyžadujúcich viacstupňové uvažovanie, ako je riešenie matematických problémov či detailná analýza, možno premýšľanie zapnúť a presne nastaviť.

Ako sa AI čoraz viac začleňuje do firemných procesov, prístup Googlu s nastaviteľným uvažovaním odráža vyzretý trh, kde je optimalizácia nákladov a dolaďovanie výkonu rovnako dôležité ako samotné schopnosti – čo signalizuje novú fázu v komercializácii generatívnych AI technológií.

Source:

Latest News