menu
close

Google proširuje obitelj Gemini 2.5 ultra-efikasnim Flash-Lite modelom

Google je proširio svoju obitelj Gemini 2.5 modela tako što je učinio Gemini 2.5 Flash i Pro općenito dostupnima, dok je ujedno predstavio 2.5 Flash-Lite u preview verziji – njihov najisplativiji i najbrži 2.5 model do sada. Flash-Lite je model za rezoniranje optimiziran za trošak i brzinu, s "razmišljanjem" isključenim po zadanim postavkama, nudeći još povoljniju opciju za slučajeve korištenja osjetljive na latenciju koji zahtijevaju manju inteligenciju modela. U međuvremenu, Gemini 2.5 Pro postao je vodeći model na svjetskim WebDev Arena i LMArena ljestvicama, što pokazuje Googleov kontinuirani napredak u području umjetne inteligencije.
Google proširuje obitelj Gemini 2.5 ultra-efikasnim Flash-Lite modelom

Google je objavio da su Gemini 2.5 Flash i 2.5 Pro sada stabilni i općenito dostupni, pružajući organizacijama pouzdanost i skalabilnost potrebnu za sigurno implementiranje naprednih AI mogućnosti u ključne poslovne aplikacije. Uz ove modele, kompanija je predstavila i Gemini 2.5 Flash-Lite u preview verziji, koji opisuje kao svoj najisplativiji i najbrži 2.5 model do sada.

Gemini 2.5 Flash-Lite je model za rezoniranje koji omogućuje dinamičku kontrolu "budžeta razmišljanja" putem API parametra. Za razliku od drugih modela iz obitelji 2.5, Flash-Lite je optimiziran za trošak i brzinu, s "razmišljanjem" isključenim po zadanim postavkama. Unatoč ovim optimizacijama, podržava sve izvorne alate, uključujući Grounding s Google pretragom, izvršavanje koda i kontekst putem URL-a, uz podršku za pozivanje funkcija.

Flash-Lite donosi veću učinkovitost od prethodnog Flash-Lite modela i 1,5 puta je brži od 2.0 Flash modela, uz niže troškove. Posebno je dizajniran za zadatke velikog obujma i osjetljive na latenciju, poput prevođenja, klasifikacije, inteligentnog usmjeravanja i drugih operacija gdje su troškovi i skalabilnost ključni.

Model ima znatno bolje rezultate od 2.0 Flash-Lite modela na testovima kodiranja, matematike, znanosti, rezoniranja i multimodalnih zadataka, što ga čini idealnim za zadatke velikog obujma.

Kao i ostali modeli iz Gemini 2.5 obitelji, Flash-Lite dolazi s mogućnostima koje ga čine korisnim, uključujući mogućnost uključivanja "razmišljanja" na različitim razinama, povezivanje s alatima poput Grounding s Google pretragom i izvršavanja koda, multimodalni unos te kontekst duljine do milijun tokena.

Kako bi odgovori bili aktualni i točni, Flash-Lite može koristiti Google pretragu kao ugrađeni alat te inteligentno odlučuje kada će koristiti pretragu za proširenje svog znanja.

Osim predstavljanja Flash-Lite modela, Google je objavio da je Gemini 2.5 Pro postao vodeći model na svjetskim ljestvicama WebDev Arena i LMArena. S ELO rezultatom od 1415 na WebDev Arena ljestvici za kodiranje, vodi na svim ljestvicama u LMArena, koja mjeri ljudske preferencije u više dimenzija.

Dodatno, Google je izravno integrirao LearnLM u Gemini 2.5, čime je ovaj model postao vodeći u svijetu za učenje. Prema najnovijem izvješću, Gemini 2.5 Pro nadmašio je konkurenciju u svim kategorijama principa znanosti o učenju, a edukatori i stručnjaci za pedagogiju preferirali su ga u odnosu na druge modele u raznim scenarijima učenja.

Gemini 2.5 Flash-Lite sada je dostupan u preview verziji u Google AI Studio i Vertex AI, uz stabilne verzije 2.5 Flash i Pro modela. Programeri mogu pristupiti modelu (gemini-2.5-flash-lite-preview-06-17) putem Google Gen AI SDK-a, koji pruža jedinstveno sučelje za cijelu obitelj Gemini 2.5 modela, bilo kroz Gemini Developer API ili Vertex AI Gemini API.

Source:

Latest News