Google spustil náhľadovú verziu Gemini 2.5 Flash, najnovšiu iteráciu svojho efektívneho AI modelu navrhnutého na vyváženie výkonu, rýchlosti a nákladovej efektivity.
Na základoch Gemini 2.0 Flash prináša nový model 2.5 Flash výrazné vylepšenie schopností uvažovania pri zachovaní povesti efektívnosti. Google ho opisuje ako „významný posun v schopnostiach uvažovania, pričom stále uprednostňuje rýchlosť a náklady.“
Najvýraznejšou črtou Gemini 2.5 Flash je jeho hybridný systém uvažovania. Ide o „prvý plne hybridný model uvažovania od Googlu, ktorý umožňuje vývojárom zapnúť alebo vypnúť myslenie a nastaviť rozpočet na myslenie s cieľom optimalizovať rovnováhu medzi kvalitou, nákladmi a latenciou.“ Tento inovatívny prístup dáva vývojárom bezprecedentnú kontrolu nad tým, ako model spracováva zložité úlohy.
V praxi to znamená, že vývojári môžu určiť „rozpočet na myslenie“, ktorý riadi, koľko uvažovania model vykoná. Môžu upraviť „počet tokenov, ktoré model môže generovať počas myslenia“ od 0 do 24 576 tokenov pomocou posuvníka v Google AI Studio a Vertex AI alebo prostredníctvom API parametra. Ak je rozpočet na myslenie nastavený na nulu, model zodpovedá nákladom a latencii Gemini 2.0 Flash.
Cenotvorba odráža túto flexibilitu: vstupné tokeny stoja 15 centov za milión a výstupné tokeny 60 centov za milión bez uvažovania. Pri aktivovaní schopností myslenia sa cena zvyšuje na 3,50 USD za milión tokenov.
Testy v benchmarkoch ukazujú pôsobivé výsledky. Gemini 2.5 Flash „dosahuje vynikajúce výsledky na Hard Prompts v LMArena, hneď za 2.5 Pro“ a „má porovnateľné metriky s inými poprednými modelmi za zlomok ceny a veľkosti“, pričom „naďalej vedie ako model s najlepším pomerom cena/výkon.“
Google označuje 2.5 Flash za svoj „najefektívnejší pracovný model navrhnutý pre rýchlosť a nízke náklady“ a zdôrazňuje, že „sa zlepšil v kľúčových benchmarkoch pre uvažovanie, multimodalitu, kód a dlhý kontext, pričom je ešte efektívnejší a v hodnoteniach používa o 20–30 % menej tokenov.“
Nový model je momentálne dostupný v režime náhľadu cez viacero kanálov. Postupne sa zavádza „v Google AI Studio (pre vývojárov), Vertex AI (pre firmy) a v aplikácii Gemini (pre všetkých).“ Podľa oznámení z Google I/O 2025 bude aktualizovaná verzia „všeobecne dostupná v Google AI Studio pre vývojárov a vo Vertex AI pre podniky začiatkom júna“, pričom Gemini 2.5 Pro bude nasledovať „čoskoro potom“.
Ako Google pokračuje v rozširovaní svojich AI schopností, Gemini 2.5 Flash predstavuje významný krok vpred v sprístupňovaní pokročilého uvažovania vývojárom a používateľom za dostupnejšiu cenu.