Google lansează Gemini 2.5 Flash-Lite ultra-eficient pentru AI cu buget redus

Pe 15 iulie 2025, Google și-a extins familia Gemini 2.5 prin lansarea oficială a Flash-Lite, cel mai eficient din punct de vedere al costurilor și cel mai rapid model din seria 2.5. Această lansare coincide cu disponibilitatea generală a modelelor Gemini 2.5 Flash și Pro pentru toți utilizatorii. Flash-Lite este conceput pentru a oferi performanțe superioare în sarcini cu volum mare, menținând totodată cea mai mică latență și cel mai scăzut cost din gama Gemini 2.5.

Google a lansat oficial Gemini 2.5 Flash-Lite, marcând un progres semnificativ în direcția accesibilizării și eficientizării inteligenței artificiale pentru dezvoltatori și companii deopotrivă.

Noul model, descris drept „cel mai eficient din punct de vedere al costurilor și cel mai rapid model 2.5 de până acum” de către Google, este optimizat pentru operațiuni cu volum mare și sensibilitate la latență. Flash-Lite intră pe piață cu cea mai mică latență și cel mai scăzut cost din familia de modele 2.5, fiind conceput ca un upgrade economic față de modelele Flash 1.5 și 2.0 anterioare. Acesta oferă performanțe îmbunătățite în majoritatea evaluărilor, cu un timp mai redus până la primul token și o rată mai mare de decodare a tokenilor pe secundă, făcându-l ideal pentru sarcini cu debit ridicat precum clasificarea sau sumarizarea la scară largă.

Ca model de raționament, Flash-Lite permite controlul dinamic al bugetului de „gândire” printr-un parametru API. Spre deosebire de celelalte modele Gemini 2.5, unde gândirea este activată implicit, Flash-Lite optimizează costul și viteza menținând gândirea dezactivată, cu excepția cazului în care este solicitată explicit. În ciuda acestei optimizări, modelul suportă toate instrumentele native, inclusiv ancorarea în Google Search, execuția de cod, contextul URL și apelarea de funcții.

Testele de performanță arată că Flash-Lite este de 1,5 ori mai rapid decât Gemini 2.0 Flash la un cost mai mic, ceea ce îl face deosebit de potrivit pentru sarcini precum clasificare, traducere, rutare inteligentă și alte operațiuni la scară mare, sensibile la cost. În timp ce alte modele pot apela implicit la instrumente de raționament mai puternice (și mai costisitoare) pentru a răspunde la întrebări, Flash-Lite oferă dezvoltatorilor control asupra acestui proces. Utilizatorii pot activa sau dezactiva capacitatea de „gândire” în funcție de nevoile specifice, iar în ciuda eficienței sale de cost, Flash-Lite nu este limitat în ceea ce poate realiza.

Preview-ul Gemini 2.5 Flash-Lite este acum disponibil în Google AI Studio și Vertex AI, alături de versiunile stabile ale 2.5 Flash și Pro. Atât 2.5 Flash, cât și Pro sunt accesibile și în aplicația Gemini, iar Google a adus versiuni personalizate ale 2.5 Flash-Lite și Flash în Search.

Această extindere strategică a familiei de modele Gemini reprezintă angajamentul Google de a democratiza AI-ul, oferind opțiuni care echilibrează performanța, costul și viteza pentru diverse cazuri de utilizare, de la sarcini complexe de raționament la procesarea de date cu volum ridicat.

Source:

Google lansează Gemini 2.5 Flash-Lite ultra-eficient pentru AI cu buget redus

Latest News

Google lansează Gemini CLI: Asistent AI pentru terminalele dezvoltatorilor

Google lansează Imagen 4 cu randare revoluționară a textului

Inteligența artificială Google revoluționează îngrijirea oncologică cu instrumente inovatoare de detecție

Inteligența autonomă a roboților, adusă de AI-ul local de la Google

Companiile duc lipsă de abilități umane esențiale pentru succesul în era inteligenței artificiale

VentureBeat Dezvăluie o Schimbare Majoră pe Piața AI în Analiza pentru 2025

GPT-5 de la OpenAI va unifica capabilitățile AI într-un singur model puternic

Pariul de 14,8 miliarde de dolari al Meta pe AI: Disperare sau geniu strategic?

Giganții tehnologici adoptă energia nucleară pentru a susține cerințele energetice ale inteligenței artificiale

Dailymotion dezvăluie revoluția platformei video alimentate de inteligență artificială

Google lansează Gemini 2.5 Flash-Lite ultra-eficient pentru AI cu buget redus

Related Articles

Inteligența autonomă a roboților, adusă de AI-ul local de la Google

Google lansează Imagen 4 cu randare revoluționară a textului

Google lansează Gemini CLI: Asistent AI pentru terminalele dezvoltatorilor

Kimi K2 de la Moonshot AI, modelul cu un trilion de parametri, provoacă giganții AI

Google extinde Gemini Live cu integrări mai profunde ale aplicațiilor

Latest News

Google lansează Gemini CLI: Asistent AI pentru terminalele dezvoltatorilor

Google lansează Imagen 4 cu randare revoluționară a textului

Inteligența artificială Google revoluționează îngrijirea oncologică cu instrumente inovatoare de detecție

Inteligența autonomă a roboților, adusă de AI-ul local de la Google

Companiile duc lipsă de abilități umane esențiale pentru succesul în era inteligenței artificiale

VentureBeat Dezvăluie o Schimbare Majoră pe Piața AI în Analiza pentru 2025

GPT-5 de la OpenAI va unifica capabilitățile AI într-un singur model puternic

Pariul de 14,8 miliarde de dolari al Meta pe AI: Disperare sau geniu strategic?

Giganții tehnologici adoptă energia nucleară pentru a susține cerințele energetice ale inteligenței artificiale

Dailymotion dezvăluie revoluția platformei video alimentate de inteligență artificială