menu
close

Google predstavuje mimoriadne efektívny Gemini 2.5 Flash-Lite pre cenovo citlivú AI

Dňa 15. júla 2025 Google rozšíril svoju rodinu Gemini 2.5 oficiálnym uvedením Flash-Lite, svojho najúspornejšieho a najrýchlejšieho modelu v sérii 2.5. Tento krok prichádza súčasne so sprístupnením modelov Gemini 2.5 Flash a Pro pre všetkých používateľov. Flash-Lite je navrhnutý tak, aby poskytoval vynikajúci výkon pri vysokom zaťažení a zároveň si udržiaval najnižšiu latenciu a náklady v rámci radu Gemini 2.5.
Google predstavuje mimoriadne efektívny Gemini 2.5 Flash-Lite pre cenovo citlivú AI

Google oficiálne uviedol na trh Gemini 2.5 Flash-Lite, čím urobil významný krok v sprístupňovaní výkonných AI riešení pre vývojárov aj firmy.

Nový model, označovaný ako „najúspornejší a najrýchlejší model 2.5 od Googlu“, je optimalizovaný pre operácie s vysokým objemom a citlivosťou na latenciu. Flash-Lite vstupuje na trh s najnižšou latenciou a nákladmi v rodine modelov 2.5, pričom je navrhnutý ako cenovo efektívny upgrade oproti predchádzajúcim modelom Flash 1.5 a 2.0. Ponúka lepší výkon vo väčšine hodnotení, s kratším časom do prvého tokenu a vyšším počtom tokenov za sekundu pri dekódovaní, čo ho robí ideálnym pre úlohy s vysokou priepustnosťou, ako je klasifikácia alebo sumarizácia vo veľkom rozsahu.

Ako model určený na uvažovanie umožňuje Flash-Lite dynamicky riadiť rozpočet na "premýšľanie" prostredníctvom API parametra. Na rozdiel od iných modelov Gemini 2.5, kde je uvažovanie predvolene zapnuté, Flash-Lite optimalizuje náklady a rýchlosť tým, že túto funkciu ponecháva vypnutú, pokiaľ nie je výslovne aktivovaná. Napriek tejto optimalizácii stále podporuje všetky natívne nástroje vrátane prepojenia na Google Search, vykonávania kódu, kontextu z URL či volania funkcií.

Testy výkonu ukazujú, že Flash-Lite je 1,5-krát rýchlejší ako Gemini 2.0 Flash pri nižších nákladoch, čo ho predurčuje najmä na úlohy ako klasifikácia, preklad, inteligentné smerovanie a ďalšie cenovo citlivé operácie vo veľkom rozsahu. Kým iné modely môžu na odpovedanie na otázky predvolene využívať výkonnejšie (a drahšie) nástroje na uvažovanie, Flash-Lite dáva vývojárom kontrolu nad týmto procesom. Používatelia môžu možnosť uvažovania zapínať alebo vypínať podľa svojich potrieb a napriek svojej úspornosti nie je Flash-Lite nijako obmedzený vo svojich možnostiach.

Náhľad Gemini 2.5 Flash-Lite je už dostupný v Google AI Studio a Vertex AI, spolu so stabilnými verziami 2.5 Flash a Pro. Obe verzie 2.5 Flash aj Pro sú prístupné aj v aplikácii Gemini a Google priniesol vlastné verzie 2.5 Flash-Lite a Flash aj do Vyhľadávania.

Toto strategické rozšírenie rodiny modelov Gemini predstavuje záväzok Googlu demokratizovať AI poskytovaním možností, ktoré vyvažujú výkon, náklady a rýchlosť pre rôzne prípady použitia – od komplexných úloh vyžadujúcich uvažovanie až po spracovanie veľkých objemov dát.

Source:

Latest News