Google har nu officiellt lanserat Gemini 2.5 Flash-Lite, vilket markerar ett betydande steg mot att göra kraftfull AI mer tillgänglig och effektiv för både utvecklare och företag.
Den nya modellen, som beskrivs som Googles "mest kostnadseffektiva och snabbaste 2.5-modell hittills", är optimerad för högvolym- och latenskänsliga operationer. Flash-Lite lanseras med den lägsta latensen och kostnaden i 2.5-familjen och är tänkt som ett prisvärt uppgraderingsalternativ från tidigare 1.5- och 2.0 Flash-modeller. Den erbjuder bättre prestanda i de flesta utvärderingar, med kortare tid till första token och högre tokens per sekund vid avkodning, vilket gör den idealisk för uppgifter med högt dataflöde som klassificering eller storskalig summering.
Som resonemangsmodell ger Flash-Lite dynamisk kontroll över "tänkarbudgeten" via en API-parameter. Till skillnad från andra Gemini 2.5-modeller, där tänkande är aktiverat som standard, optimerar Flash-Lite för kostnad och hastighet genom att hålla tänkandet avstängt om det inte aktiveras specifikt. Trots denna optimering stöder modellen fortfarande alla inbyggda verktyg, inklusive Google Search-grundning, kodexekvering, URL-kontekst och funktionsanrop.
Prestandatester visar att Flash-Lite är 1,5 gånger snabbare än Gemini 2.0 Flash till en lägre kostnad, vilket gör den särskilt lämpad för uppgifter som klassificering, översättning, intelligent dirigering och andra kostnadskänsliga, storskaliga operationer. Medan andra modeller kan använda mer kraftfulla (och dyrare) resonemangsverktyg som standard för att besvara frågor, ger Flash-Lite utvecklare kontroll över denna process. Användare kan slå på eller av tänkandefunktionen beroende på specifika behov, och trots sin kostnadseffektivitet är Flash-Lite inte begränsad i vad den kan åstadkomma.
Förhandsvisningen av Gemini 2.5 Flash-Lite är nu tillgänglig i Google AI Studio och Vertex AI, tillsammans med de stabila versionerna av 2.5 Flash och Pro. Både 2.5 Flash och Pro finns även i Gemini-appen, och Google har även tagit fram specialanpassade versioner av 2.5 Flash-Lite och Flash för Search.
Denna strategiska utökning av Gemini-modellfamiljen visar Googles engagemang för att demokratisera AI genom att erbjuda alternativ som balanserar prestanda, kostnad och hastighet för olika användningsområden – från komplexa resonemangsuppgifter till databehandling i stor skala.