Google oficiálne uviedol na trh Gemini 2.5 Flash-Lite, čím urobil významný krok v sprístupňovaní výkonných AI riešení pre vývojárov aj firmy.
Nový model, označovaný ako „najúspornejší a najrýchlejší model 2.5 od Googlu“, je optimalizovaný pre operácie s vysokým objemom a citlivosťou na latenciu. Flash-Lite vstupuje na trh s najnižšou latenciou a nákladmi v rodine modelov 2.5, pričom je navrhnutý ako cenovo efektívny upgrade oproti predchádzajúcim modelom Flash 1.5 a 2.0. Ponúka lepší výkon vo väčšine hodnotení, s kratším časom do prvého tokenu a vyšším počtom tokenov za sekundu pri dekódovaní, čo ho robí ideálnym pre úlohy s vysokou priepustnosťou, ako je klasifikácia alebo sumarizácia vo veľkom rozsahu.
Ako model určený na uvažovanie umožňuje Flash-Lite dynamicky riadiť rozpočet na "premýšľanie" prostredníctvom API parametra. Na rozdiel od iných modelov Gemini 2.5, kde je uvažovanie predvolene zapnuté, Flash-Lite optimalizuje náklady a rýchlosť tým, že túto funkciu ponecháva vypnutú, pokiaľ nie je výslovne aktivovaná. Napriek tejto optimalizácii stále podporuje všetky natívne nástroje vrátane prepojenia na Google Search, vykonávania kódu, kontextu z URL či volania funkcií.
Testy výkonu ukazujú, že Flash-Lite je 1,5-krát rýchlejší ako Gemini 2.0 Flash pri nižších nákladoch, čo ho predurčuje najmä na úlohy ako klasifikácia, preklad, inteligentné smerovanie a ďalšie cenovo citlivé operácie vo veľkom rozsahu. Kým iné modely môžu na odpovedanie na otázky predvolene využívať výkonnejšie (a drahšie) nástroje na uvažovanie, Flash-Lite dáva vývojárom kontrolu nad týmto procesom. Používatelia môžu možnosť uvažovania zapínať alebo vypínať podľa svojich potrieb a napriek svojej úspornosti nie je Flash-Lite nijako obmedzený vo svojich možnostiach.
Náhľad Gemini 2.5 Flash-Lite je už dostupný v Google AI Studio a Vertex AI, spolu so stabilnými verziami 2.5 Flash a Pro. Obe verzie 2.5 Flash aj Pro sú prístupné aj v aplikácii Gemini a Google priniesol vlastné verzie 2.5 Flash-Lite a Flash aj do Vyhľadávania.
Toto strategické rozšírenie rodiny modelov Gemini predstavuje záväzok Googlu demokratizovať AI poskytovaním možností, ktoré vyvažujú výkon, náklady a rýchlosť pre rôzne prípady použitia – od komplexných úloh vyžadujúcich uvažovanie až po spracovanie veľkých objemov dát.