menu
close

Google lanserar ultrabilliga Gemini 2.5 Flash-Lite för kostnadskänslig AI

Den 15 juli 2025 utökade Google sin Gemini 2.5-familj genom att officiellt lansera Flash-Lite, deras mest kostnadseffektiva och snabbaste modell i 2.5-serien. Lanseringen sker samtidigt som Gemini 2.5 Flash och Pro blir allmänt tillgängliga för alla användare. Flash-Lite är utformad för att leverera överlägsen prestanda för högvolymuppgifter, med lägsta latens och kostnad i Gemini 2.5-serien.
Google lanserar ultrabilliga Gemini 2.5 Flash-Lite för kostnadskänslig AI

Google har nu officiellt lanserat Gemini 2.5 Flash-Lite, vilket markerar ett betydande steg mot att göra kraftfull AI mer tillgänglig och effektiv för både utvecklare och företag.

Den nya modellen, som beskrivs som Googles "mest kostnadseffektiva och snabbaste 2.5-modell hittills", är optimerad för högvolym- och latenskänsliga operationer. Flash-Lite lanseras med den lägsta latensen och kostnaden i 2.5-familjen och är tänkt som ett prisvärt uppgraderingsalternativ från tidigare 1.5- och 2.0 Flash-modeller. Den erbjuder bättre prestanda i de flesta utvärderingar, med kortare tid till första token och högre tokens per sekund vid avkodning, vilket gör den idealisk för uppgifter med högt dataflöde som klassificering eller storskalig summering.

Som resonemangsmodell ger Flash-Lite dynamisk kontroll över "tänkarbudgeten" via en API-parameter. Till skillnad från andra Gemini 2.5-modeller, där tänkande är aktiverat som standard, optimerar Flash-Lite för kostnad och hastighet genom att hålla tänkandet avstängt om det inte aktiveras specifikt. Trots denna optimering stöder modellen fortfarande alla inbyggda verktyg, inklusive Google Search-grundning, kodexekvering, URL-kontekst och funktionsanrop.

Prestandatester visar att Flash-Lite är 1,5 gånger snabbare än Gemini 2.0 Flash till en lägre kostnad, vilket gör den särskilt lämpad för uppgifter som klassificering, översättning, intelligent dirigering och andra kostnadskänsliga, storskaliga operationer. Medan andra modeller kan använda mer kraftfulla (och dyrare) resonemangsverktyg som standard för att besvara frågor, ger Flash-Lite utvecklare kontroll över denna process. Användare kan slå på eller av tänkandefunktionen beroende på specifika behov, och trots sin kostnadseffektivitet är Flash-Lite inte begränsad i vad den kan åstadkomma.

Förhandsvisningen av Gemini 2.5 Flash-Lite är nu tillgänglig i Google AI Studio och Vertex AI, tillsammans med de stabila versionerna av 2.5 Flash och Pro. Både 2.5 Flash och Pro finns även i Gemini-appen, och Google har även tagit fram specialanpassade versioner av 2.5 Flash-Lite och Flash för Search.

Denna strategiska utökning av Gemini-modellfamiljen visar Googles engagemang för att demokratisera AI genom att erbjuda alternativ som balanserar prestanda, kostnad och hastighet för olika användningsområden – från komplexa resonemangsuppgifter till databehandling i stor skala.

Source:

Latest News