menu
close

Google predstavlja ultra-efikasni Gemini 2.5 Flash-Lite za cjenovno osjetljivu umjetnu inteligenciju

Dana 15. srpnja 2025., Google je proširio svoju Gemini 2.5 obitelj službenim lansiranjem Flash-Lite modela, najisplativijeg i najbržeg modela u seriji 2.5. Ovo izdanje dolazi uz opću dostupnost Gemini 2.5 Flash i Pro modela za sve korisnike. Flash-Lite je dizajniran za vrhunsku izvedbu u zadacima visokog protoka podataka, uz najnižu latenciju i cijenu u Gemini 2.5 ponudi.
Google predstavlja ultra-efikasni Gemini 2.5 Flash-Lite za cjenovno osjetljivu umjetnu inteligenciju

Google je službeno lansirao Gemini 2.5 Flash-Lite, čime je napravljen značajan iskorak u približavanju snažne umjetne inteligencije razvojnim inženjerima i tvrtkama na učinkovitiji i pristupačniji način.

Novi model, koji Google opisuje kao "najisplativiji i najbrži 2.5 model do sada", optimiziran je za operacije visokog volumena i osjetljive na latenciju. Flash-Lite ulazi na tržište s najnižom latencijom i cijenom u obitelji 2.5 modela, osmišljen kao isplativa nadogradnja na prethodne 1.5 i 2.0 Flash modele. Nudi bolje performanse u većini evaluacija, s kraćim vremenom do prvog tokena i većim brojem dekodiranih tokena u sekundi, što ga čini idealnim za zadatke visokog protoka poput klasifikacije ili sažimanja u velikom opsegu.

Kao model za rezoniranje, Flash-Lite omogućuje dinamičku kontrolu 'thinking budgeta' putem API parametra. Za razliku od drugih Gemini 2.5 modela kod kojih je razmišljanje uključeno po defaultu, Flash-Lite optimizira trošak i brzinu tako što razmišljanje ostaje isključeno osim ako ga korisnik ne uključi. Unatoč ovoj optimizaciji, podržava sve izvorne alate uključujući Google Search grounding, izvršavanje koda, kontekst URL-a i pozivanje funkcija.

Testovi performansi pokazuju da je Flash-Lite 1,5 puta brži od Gemini 2.0 Flash modela uz nižu cijenu, što ga čini posebno pogodnim za zadatke poput klasifikacije, prevođenja, inteligentnog usmjeravanja i drugih cjenovno osjetljivih operacija u velikom opsegu. Dok drugi modeli po defaultu koriste snažnije (i skuplje) alate za rezoniranje kako bi odgovorili na pitanja, Flash-Lite daje programerima kontrolu nad tim procesom. Korisnici mogu uključiti ili isključiti mogućnost razmišljanja ovisno o specifičnim potrebama, a unatoč svojoj isplativosti, Flash-Lite nije ograničen u onome što može postići.

Pregled Gemini 2.5 Flash-Lite modela sada je dostupan u Google AI Studio i Vertex AI, uz stabilne verzije 2.5 Flash i Pro modela. Oba modela, 2.5 Flash i Pro, dostupna su i u Gemini aplikaciji, a Google je prilagođene verzije 2.5 Flash-Lite i Flash modela donio i u Search.

Ova strateška ekspanzija Gemini modela pokazuje Googleovu predanost demokratizaciji umjetne inteligencije, nudeći opcije koje uravnotežuju performanse, cijenu i brzinu za različite primjene — od složenih zadataka rezoniranja do obrade velikih količina podataka.

Source:

Latest News