Google spustil náhledovou verzi Gemini 2.5 Flash, nejnovější iterace svého efektivního AI modelu navrženého pro rovnováhu mezi výkonem, rychlostí a nákladovou efektivitou.
Nový model 2.5 Flash staví na základech Gemini 2.0 Flash a přináší zásadní vylepšení schopností uvažování při zachování pověsti efektivity. Google jej popisuje jako „zásadní vylepšení schopností uvažování, přičemž stále upřednostňuje rychlost a náklady.“
Hlavní předností Gemini 2.5 Flash je jeho hybridní systém uvažování. Jde o „první plně hybridní model uvažování od Googlu, který umožňuje vývojářům zapínat či vypínat myšlení a nastavovat rozpočty na myšlení pro optimalizaci rovnováhy mezi kvalitou, náklady a latencí.“ Tento inovativní přístup dává vývojářům bezprecedentní kontrolu nad tím, jak model zpracovává složité úlohy.
V praxi to znamená, že vývojáři mohou nastavit „rozpočet na myšlení“, který určuje, kolik uvažování model provede. Mohou upravovat „počet tokenů, které model může generovat během myšlení“ od 0 do 24 576 tokenů pomocí posuvníku v Google AI Studio a Vertex AI, nebo prostřednictvím parametru API. Pokud je rozpočet na myšlení nastaven na nulu, model odpovídá nákladům a latenci Gemini 2.0 Flash.
Cenová politika tuto flexibilitu odráží: vstupní tokeny stojí 15 centů za milion a výstupní tokeny 60 centů za milion bez uvažování. S aktivovanými schopnostmi myšlení cena stoupá na 3,50 USD za milion tokenů.
Testy v benchmarcích ukazují působivé výsledky. Gemini 2.5 Flash „dosahuje vynikajících výsledků na Hard Prompts v LMArena, kde je hned za 2.5 Pro“ a „má srovnatelné metriky s ostatními špičkovými modely za zlomek jejich ceny a velikosti“, přičemž „stále vede jako model s nejlepším poměrem cena/výkon.“
Google popisuje 2.5 Flash jako svůj „nejefektivnější pracovní model navržený pro rychlost a nízké náklady“ a zdůrazňuje, že „byl vylepšen napříč klíčovými benchmarky pro uvažování, multimodalitu, kód i dlouhý kontext a zároveň je ještě efektivnější, protože při hodnocení využívá o 20–30 % méně tokenů.“
Nový model je momentálně k dispozici v režimu náhledu prostřednictvím několika kanálů. Je zaváděn „v Google AI Studio (pro vývojáře), Vertex AI (pro podniky) a v aplikaci Gemini (pro všechny).“ Podle oznámení Google I/O 2025 bude aktualizovaná verze „obecně dostupná v Google AI Studio pro vývojáře a ve Vertex AI pro podniky začátkem června“, přičemž Gemini 2.5 Pro bude následovat „krátce poté.“
Jak Google dále rozšiřuje své AI schopnosti, Gemini 2.5 Flash představuje významný krok vpřed v tom, jak zpřístupnit pokročilé uvažování vývojářům i běžným uživatelům za rozumnou cenu.