Google oficiálně představil Gemini 2.5 Flash-Lite, což znamená významný posun v dostupnosti a efektivitě výkonné AI pro vývojáře i firmy.
Nový model, který Google označuje jako „nejúspornější a nejrychlejší model 2.5“, je optimalizován pro operace s vysokým objemem dat a citlivostí na latenci. Flash-Lite vstupuje na trh s nejnižší latencí a náklady v rodině modelů 2.5 a je navržen jako cenově výhodný upgrade oproti předchozím modelům 1.5 a 2.0 Flash. Nabízí lepší výkon ve většině hodnocení, kratší čas do prvního tokenu a vyšší rychlost dekódování tokenů za sekundu, což jej činí ideálním pro úlohy s vysokou propustností, jako je klasifikace nebo sumarizace ve velkém měřítku.
Jako model pro deduktivní úlohy umožňuje Flash-Lite dynamicky řídit rozpočet na „přemýšlení“ prostřednictvím API parametru. Na rozdíl od ostatních modelů Gemini 2.5, kde je přemýšlení ve výchozím nastavení zapnuto, Flash-Lite optimalizuje náklady a rychlost tím, že přemýšlení ponechává vypnuté, pokud není výslovně povoleno. Přesto však podporuje všechny nativní nástroje včetně ukotvení na Google Search, spouštění kódu, kontextu z URL a volání funkcí.
Testy výkonu ukazují, že Flash-Lite je 1,5krát rychlejší než Gemini 2.0 Flash při nižších nákladech, což jej činí obzvláště vhodným pro úlohy jako klasifikace, překlad, inteligentní směrování a další cenově citlivé operace ve velkém měřítku. Zatímco jiné modely mohou ve výchozím nastavení používat výkonnější (a dražší) deduktivní nástroje pro zodpovídání dotazů, Flash-Lite dává vývojářům kontrolu nad tímto procesem. Uživatelé mohou schopnost „přemýšlení“ zapínat nebo vypínat podle svých potřeb a navzdory své úspornosti není Flash-Lite nijak omezen v tom, co dokáže.
Preview Gemini 2.5 Flash-Lite je nyní k dispozici v Google AI Studio a Vertex AI spolu se stabilními verzemi 2.5 Flash a Pro. Oba modely 2.5 Flash i Pro jsou také přístupné v aplikaci Gemini a Google přinesl vlastní verze 2.5 Flash-Lite a Flash i do Vyhledávání.
Tato strategická expanze rodiny modelů Gemini představuje závazek Googlu demokratizovat AI tím, že nabízí možnosti vyvažující výkon, náklady a rychlost pro různé scénáře použití – od komplexních deduktivních úloh až po zpracování velkých objemů dat.