Inilunsad ng Google ang preview version ng Gemini 2.5 Flash, ang pinakabagong bersyon ng episyenteng AI model nito na idinisenyo upang balansehin ang performance, bilis, at tipid sa gastos.
Batay sa pundasyon ng Gemini 2.0 Flash, naghahatid ang bagong 2.5 Flash model ng malaking pag-angat sa kakayahan sa pangangatwiran habang pinananatili ang reputasyon nito sa episyensya. Inilarawan ito ng Google bilang "isang malaking pag-upgrade sa kakayahan sa pangangatwiran, habang inuuna pa rin ang bilis at gastos."
Ang pangunahing tampok ng Gemini 2.5 Flash ay ang hybrid reasoning system nito. Ito ang "unang ganap na hybrid reasoning model ng Google, na nagbibigay-daan sa mga developer na buksan o patayin ang pag-iisip, at magtakda ng thinking budgets upang i-optimize ang balanse ng kalidad, gastos, at latency." Sa makabagong approach na ito, nabibigyan ng walang kapantay na kontrol ang mga developer kung paano pinoproseso ng modelo ang mga komplikadong gawain.
Sa praktika, nangangahulugan ito na maaaring tukuyin ng mga developer ang "thinking budget" na kumokontrol kung gaano karaming pangangatwiran ang gagawin ng modelo. Maaaring ayusin ang "bilang ng tokens na maaaring likhain ng modelo habang nag-iisip" mula 0 hanggang 24,576 tokens gamit ang slider sa Google AI Studio at Vertex AI, o sa pamamagitan ng API parameter. Kapag ang thinking budget ay naka-set sa zero, tumutugma ang gastos at latency nito sa Gemini 2.0 Flash.
Ipinapakita rin sa presyo ang flexibility na ito, kung saan ang input tokens ay nagkakahalaga ng 15 sentimo kada milyon at output tokens ay 60 sentimo kada milyon kung walang reasoning. Kapag pinagana ang kakayahan sa pag-iisip, tumataas ang gastos sa $3.50 kada milyong tokens.
Ipinapakita ng mga benchmark test ang kahanga-hangang resulta. Ang Gemini 2.5 Flash ay "malakas ang performance sa Hard Prompts sa LMArena, pumapangalawa lamang sa 2.5 Pro" at "may katumbas na metrics sa iba pang nangungunang modelo sa mas mababang gastos at laki," at patuloy na "nangunguna bilang modelong may pinakamahusay na price-to-performance ratio."
Inilarawan ng Google ang 2.5 Flash bilang "pinaka-episyenteng workhorse model nito na idinisenyo para sa bilis at mababang gastos," at binanggit na "mas gumanda pa ito sa mga pangunahing benchmark para sa reasoning, multimodality, code, at long context habang naging mas episyente pa, gamit ang 20-30% mas kaunting tokens" sa mga pagsusuri.
Ang bagong modelo ay kasalukuyang available sa preview mode sa iba't ibang channel. Inilulunsad ito "sa Google AI Studio (para sa mga developer), Vertex AI (para sa enterprise), at Gemini app (para sa lahat)." Ayon sa mga anunsyo ng Google sa I/O 2025, magiging "generally available ito sa Google AI Studio para sa mga developer at sa Vertex AI para sa mga enterprise sa unang bahagi ng Hunyo," at susunod agad ang Gemini 2.5 Pro.
Habang patuloy na pinalalawak ng Google ang kakayahan ng AI nito, ang Gemini 2.5 Flash ay kumakatawan sa malaking hakbang pasulong upang gawing mas abot-kaya at episyente ang advanced reasoning para sa mga developer at user.