Google extinde familia Gemini 2.5 cu Flash-Lite ultra-eficient

Google a extins familia Gemini 2.5, lansând modelele Gemini 2.5 Flash și Pro pentru utilizare generală și introducând 2.5 Flash-Lite în versiune preview – cel mai rapid și mai eficient model 2.5 de până acum. Flash-Lite este un model de raționament optimizat pentru costuri și viteză, cu "gândirea" dezactivată implicit, oferind o opțiune și mai accesibilă pentru cazurile sensibile la latență care necesită mai puțină inteligență de model. Între timp, Gemini 2.5 Pro a devenit lider mondial pe clasamentele WebDev Arena și LMArena, demonstrând progresul continuu al Google în domeniul AI.

Google a anunțat că modelele Gemini 2.5 Flash și 2.5 Pro sunt acum stabile și disponibile la scară largă, oferind organizațiilor fiabilitatea și scalabilitatea necesare pentru a implementa cu încredere capabilități AI avansate în aplicații critice. Odată cu aceste lansări, compania a introdus și Gemini 2.5 Flash-Lite în versiune preview, descris ca fiind cel mai eficient și rapid model 2.5 de până acum.

Gemini 2.5 Flash-Lite este un model de raționament care permite controlul dinamic al bugetului de "gândire" printr-un parametru API. Spre deosebire de celelalte modele din familia 2.5, Flash-Lite este optimizat pentru costuri și viteză, cu "gândirea" dezactivată implicit. În ciuda acestor optimizări, suportă toate instrumentele native, inclusiv Grounding cu Google Search, execuție de cod și context URL, pe lângă apelarea de funcții.

Flash-Lite oferă performanțe superioare față de modelul anterior Flash-Lite și este de 1,5 ori mai rapid decât 2.0 Flash, la un cost mai redus. Este proiectat special pentru sarcini cu volum mare și latență scăzută, precum traducere, clasificare, rutare inteligentă și alte operațiuni la scară mare, sensibile la costuri.

Modelul are performanțe semnificativ mai bune decât 2.0 Flash-Lite la codare, matematică, știință, raționament și benchmark-uri multimodale, fiind ideal pentru sarcini de volum mare.

La fel ca celelalte modele din familia Gemini 2.5, Flash-Lite vine cu funcționalități utile, inclusiv posibilitatea de a activa "gândirea" la diferite bugete, conectarea la instrumente precum Grounding cu Google Search și execuție de cod, input multimodal și o lungime de context de 1 milion de tokeni.

Pentru a asigura răspunsuri actuale și factuale, Flash-Lite poate utiliza Google Search ca instrument integrat, decizând inteligent când să folosească Search pentru a-și îmbunătăți cunoștințele.

Dincolo de introducerea Flash-Lite, Google a anunțat că Gemini 2.5 Pro a devenit modelul lider mondial pe clasamentele WebDev Arena și LMArena. Cu un scor ELO de 1415 pe leaderboard-ul de codare WebDev Arena, conduce pe toate clasamentele LMArena, care măsoară preferințele umane în mai multe dimensiuni.

În plus, Google a integrat LearnLM direct în Gemini 2.5, făcându-l cel mai performant model din lume pentru învățare. Potrivit celui mai recent raport, Gemini 2.5 Pro a depășit concurența la toate categoriile de principii ale științei învățării, educatorii și experții în pedagogie preferându-l în diverse scenarii de învățare.

Gemini 2.5 Flash-Lite este acum disponibil în preview în Google AI Studio și Vertex AI, alături de versiunile stabile ale 2.5 Flash și Pro. Dezvoltatorii pot accesa modelul (gemini-2.5-flash-lite-preview-06-17) prin Google Gen AI SDK, care oferă o interfață unificată către familia de modele Gemini 2.5, atât prin Gemini Developer API, cât și prin Vertex AI Gemini API.

Source:

Google extinde familia Gemini 2.5 cu Flash-Lite ultra-eficient

Latest News

BrightAI obține 51 de milioane de dolari pentru a transforma infrastructura critică cu ajutorul inteligenței artificiale

Firestorm obține 47 de milioane de dolari pentru a revoluționa producția de drone alimentate de inteligență artificială

Startup-ul protejează datele AI cu o inovație în criptare

Unify obține 40 de milioane de dolari pentru a transforma vânzările cu semnale de intenție bazate pe inteligență artificială

Veteran în securitate cibernetică lansează o apărare alimentată de AI împotriva atacurilor țintite

Inteligența artificială a DeepMind decodează „materia întunecată” a ADN-ului, transformând cercetarea în domeniul cancerului

Amazon lansează Kiro: IDE-ul alimentat de AI care transformă dezvoltarea software

Descoperire revoluționară în AI reduce drastic amprenta de carbon a cimentului

Noua piele robotică oferă mașinilor percepție tactilă asemănătoare celei umane

OpenAI unifică instrumentele AI cu ChatGPT Agent pentru sarcini autonome

Google extinde familia Gemini 2.5 cu Flash-Lite ultra-eficient

Related Articles

Amazon lansează Kiro: IDE-ul alimentat de AI care transformă dezvoltarea software

OpenAI unifică instrumentele AI cu ChatGPT Agent pentru sarcini autonome

S&P Global lansează metadate pregătite pentru AI pentru a transforma analiza financiară

Thinking Machines Lab a lui Murati obține 2 miliarde de dolari pentru revoluția AI

Inteligența artificială de la Google efectuează acum apeluri telefonice în locul tău

Latest News

BrightAI obține 51 de milioane de dolari pentru a transforma infrastructura critică cu ajutorul inteligenței artificiale

Firestorm obține 47 de milioane de dolari pentru a revoluționa producția de drone alimentate de inteligență artificială

Startup-ul protejează datele AI cu o inovație în criptare

Unify obține 40 de milioane de dolari pentru a transforma vânzările cu semnale de intenție bazate pe inteligență artificială

Veteran în securitate cibernetică lansează o apărare alimentată de AI împotriva atacurilor țintite

Inteligența artificială a DeepMind decodează „materia întunecată” a ADN-ului, transformând cercetarea în domeniul cancerului

Amazon lansează Kiro: IDE-ul alimentat de AI care transformă dezvoltarea software

Descoperire revoluționară în AI reduce drastic amprenta de carbon a cimentului

Noua piele robotică oferă mașinilor percepție tactilă asemănătoare celei umane

OpenAI unifică instrumentele AI cu ChatGPT Agent pentru sarcini autonome