Google je lansirao preview verziju Gemini 2.5 Flash, najnoviju iteraciju svog učinkovitog AI modela dizajniranog za ravnotežu između performansi, brzine i troškova.
Nadovezujući se na temelje Gemini 2.0 Flash, novi 2.5 Flash model donosi veliko poboljšanje u mogućnostima zaključivanja, uz zadržavanje reputacije po učinkovitosti. Google ga opisuje kao "veliko poboljšanje u mogućnostima zaključivanja, uz i dalje prioritet brzine i troška."
Najistaknutija značajka Gemini 2.5 Flash je njegov hibridni sustav zaključivanja. To je Googleov "prvi potpuno hibridni model zaključivanja, koji omogućuje developerima uključivanje ili isključivanje razmišljanja te postavljanje budžeta za razmišljanje radi optimizacije ravnoteže između kvalitete, troška i latencije." Ovakav inovativan pristup daje developerima dosad neviđenu kontrolu nad načinom na koji model obrađuje složene zadatke.
U praksi to znači da developeri mogu odrediti "budžet za razmišljanje" koji kontrolira koliko model koristi zaključivanje. Mogu podesiti "broj tokena koje model može generirati tijekom razmišljanja" od 0 do 24.576 tokena pomoću klizača u Google AI Studio i Vertex AI ili putem API parametra. Kada je budžet za razmišljanje postavljen na nulu, model odgovara trošku i latenciji Gemini 2.0 Flash modela.
Cijene odražavaju ovu fleksibilnost: ulazni tokeni koštaju 15 centi po milijunu, a izlazni tokeni 60 centi po milijunu bez zaključivanja. S uključenim mogućnostima razmišljanja, cijena raste na 3,50 dolara po milijunu tokena.
Testiranja pokazuju impresivne rezultate. Gemini 2.5 Flash "postiže izvrsne rezultate na Hard Prompts u LMArena, odmah iza 2.5 Pro" i "ima usporedive metrike s vodećim modelima za djelić njihove cijene i veličine", te "nastavlja voditi kao model s najboljim omjerom cijene i performansi."
Google opisuje 2.5 Flash kao svoj "najefikasniji radni model dizajniran za brzinu i niske troškove", ističući da je "poboljšan na ključnim benchmarkovima za zaključivanje, multimodalnost, kod i dugi kontekst, uz još veću učinkovitost, koristeći 20-30% manje tokena" u evaluacijama.
Novi model trenutno je dostupan u preview načinu rada kroz više kanala. Postupno se uvodi "u Google AI Studio (za developere), Vertex AI (za poduzeća) i Gemini aplikaciju (za sve)." Prema Googleovim najavama na I/O 2025, ažurirana verzija bit će "općenito dostupna u Google AI Studio za developere i u Vertex AI za poduzeća početkom lipnja", dok će Gemini 2.5 Pro uslijediti "nedugo nakon toga."
Kako Google nastavlja širiti svoje AI mogućnosti, Gemini 2.5 Flash predstavlja značajan korak naprijed u omogućavanju naprednog zaključivanja developerima i korisnicima na pristupačan i isplativ način.