Google a anunțat că modelele Gemini 2.5 Flash și 2.5 Pro sunt acum stabile și disponibile la scară largă, oferind organizațiilor fiabilitatea și scalabilitatea necesare pentru a implementa cu încredere capabilități AI avansate în aplicații critice. Odată cu aceste lansări, compania a introdus și Gemini 2.5 Flash-Lite în versiune preview, descris ca fiind cel mai eficient și rapid model 2.5 de până acum.
Gemini 2.5 Flash-Lite este un model de raționament care permite controlul dinamic al bugetului de "gândire" printr-un parametru API. Spre deosebire de celelalte modele din familia 2.5, Flash-Lite este optimizat pentru costuri și viteză, cu "gândirea" dezactivată implicit. În ciuda acestor optimizări, suportă toate instrumentele native, inclusiv Grounding cu Google Search, execuție de cod și context URL, pe lângă apelarea de funcții.
Flash-Lite oferă performanțe superioare față de modelul anterior Flash-Lite și este de 1,5 ori mai rapid decât 2.0 Flash, la un cost mai redus. Este proiectat special pentru sarcini cu volum mare și latență scăzută, precum traducere, clasificare, rutare inteligentă și alte operațiuni la scară mare, sensibile la costuri.
Modelul are performanțe semnificativ mai bune decât 2.0 Flash-Lite la codare, matematică, știință, raționament și benchmark-uri multimodale, fiind ideal pentru sarcini de volum mare.
La fel ca celelalte modele din familia Gemini 2.5, Flash-Lite vine cu funcționalități utile, inclusiv posibilitatea de a activa "gândirea" la diferite bugete, conectarea la instrumente precum Grounding cu Google Search și execuție de cod, input multimodal și o lungime de context de 1 milion de tokeni.
Pentru a asigura răspunsuri actuale și factuale, Flash-Lite poate utiliza Google Search ca instrument integrat, decizând inteligent când să folosească Search pentru a-și îmbunătăți cunoștințele.
Dincolo de introducerea Flash-Lite, Google a anunțat că Gemini 2.5 Pro a devenit modelul lider mondial pe clasamentele WebDev Arena și LMArena. Cu un scor ELO de 1415 pe leaderboard-ul de codare WebDev Arena, conduce pe toate clasamentele LMArena, care măsoară preferințele umane în mai multe dimensiuni.
În plus, Google a integrat LearnLM direct în Gemini 2.5, făcându-l cel mai performant model din lume pentru învățare. Potrivit celui mai recent raport, Gemini 2.5 Pro a depășit concurența la toate categoriile de principii ale științei învățării, educatorii și experții în pedagogie preferându-l în diverse scenarii de învățare.
Gemini 2.5 Flash-Lite este acum disponibil în preview în Google AI Studio și Vertex AI, alături de versiunile stabile ale 2.5 Flash și Pro. Dezvoltatorii pot accesa modelul (gemini-2.5-flash-lite-preview-06-17) prin Google Gen AI SDK, care oferă o interfață unificată către familia de modele Gemini 2.5, atât prin Gemini Developer API, cât și prin Vertex AI Gemini API.