Inanunsyo ng Google ang pagpapalawak ng kanilang makabagong tampok na 'thinking budgets' sa Gemini 2.5 Pro, ang pinaka-advanced na AI reasoning model ng kumpanya, kasunod ng matagumpay na pagpapatupad nito sa Gemini 2.5 Flash noong mas maaga ngayong taon.
Ang thinking budgets ay isang malaking hakbang sa pamamahala ng gastos sa AI, dahil binibigyan nito ang mga developer ng eksaktong kontrol kung gaano karaming computational power ang ilalaan sa pagresolba ng mga komplikadong problema. Sa pamamagitan ng kakayahang ito, maaaring tukuyin ng mga user ang maximum na bilang ng tokens na gagamitin ng modelo para sa internal reasoning bago bumuo ng sagot, o kahit i-off nang tuluyan ang thinking para sa mas simpleng mga gawain.
"Inilunsad namin ang 2.5 Flash na may thinking budgets upang bigyan ang mga developer ng mas malaking kontrol sa gastos sa pamamagitan ng pagbabalanse ng latency at kalidad. At pinalalawak namin ang kakayahang ito sa 2.5 Pro," ayon sa pahayag ng Google. Kumpirmado ng kumpanya na magiging available ang Gemini 2.5 Pro na may budgets para sa stable production use sa mga darating na linggo.
Tinutugunan ng pag-unlad na ito ang pangunahing tensyon sa kasalukuyang AI marketplace, kung saan ang mas sopistikadong reasoning ay kadalasang nagdudulot ng mas mataas na latency at gastos. Halimbawa, sa Gemini 2.5 Flash, ang pag-enable ng reasoning ay halos anim na beses na nagpapataas ng output cost—mula $0.60 hanggang $3.50 kada milyong tokens. Sa pamamagitan ng thinking budgets, maaaring i-optimize ng mga negosyo ang kanilang AI deployments ayon sa partikular na gamit, at paganahin lamang ang reasoning kung kinakailangan.
Lalo itong mahalaga para sa mga enterprise customer na kailangang maingat na pamahalaan ang gastos sa AI deployment habang patuloy na nakakagamit ng advanced capabilities. Para sa mga simpleng query gaya ng pagsasalin ng wika o basic na paghahanap ng impormasyon, maaaring i-disable ang thinking para sa pinakamataas na tipid. Para naman sa mas komplikadong gawain na nangangailangan ng multi-step reasoning, tulad ng mathematical problem-solving o masusing pagsusuri, maaaring i-enable at i-fine-tune ang thinking function.
Habang lalong nagiging bahagi ng mga workflow ng negosyo ang AI, ipinapakita ng diskarte ng Google sa customizable reasoning na pumapasok na tayo sa mas mature na yugto ng merkado, kung saan ang cost optimization at performance tuning ay kasinghalaga na ng raw capabilities—hudyat ng bagong yugto sa komersyalisasyon ng generative AI technologies.