Google har lanceret en preview-version af Gemini 2.5 Flash, den nyeste udgave af deres effektive AI-model, der er designet til at balancere ydeevne med hastighed og omkostningseffektivitet.
Med udgangspunkt i Gemini 2.0 Flash leverer den nye 2.5 Flash-model en markant opgradering af ræsonnementsevnerne, samtidig med at den bevarer sit ry for effektivitet. Google beskriver den som "en stor opgradering af ræsonnementsevner, mens hastighed og omkostninger fortsat prioriteres."
Det mest markante ved Gemini 2.5 Flash er dens hybride ræsonnementssystem. Det er Googles "første fuldt hybride ræsonnementsmodel, der gør det muligt for udviklere at slå tænkning til eller fra og sætte tænke-budgetter for at optimere balancen mellem kvalitet, pris og latenstid." Denne innovative tilgang giver udviklere hidtil uset kontrol over, hvordan modellen håndterer komplekse opgaver.
I praksis betyder det, at udviklere kan angive et "tænke-budget", der styrer, hvor meget ræsonnement modellen udfører. De kan justere "antallet af tokens, modellen kan generere under tænkning" fra 0 til 24.576 tokens via en skyder i Google AI Studio og Vertex AI eller gennem en API-parameter. Når tænke-budgettet er sat til nul, matcher modellen Gemini 2.0 Flashs pris og latenstid.
Prissætningen afspejler denne fleksibilitet, hvor input-tokens koster 15 cent pr. million og output-tokens 60 cent pr. million uden ræsonnement. Med tænkning aktiveret stiger prisen til $3,50 pr. million tokens.
Benchmark-tests viser imponerende resultater. Gemini 2.5 Flash "klarer sig stærkt på Hard Prompts i LMArena, kun overgået af 2.5 Pro" og "har sammenlignelige målinger med andre førende modeller til en brøkdel af pris og størrelse," og fortsætter "med at være modellen med det bedste pris-til-ydeevne-forhold."
Google beskriver 2.5 Flash som deres "mest effektive arbejdshest-model designet til hastighed og lave omkostninger," og bemærker, at den "har forbedret sig på centrale benchmarks for ræsonnement, multimodalitet, kode og lang kontekst, samtidig med at den er blevet endnu mere effektiv og bruger 20-30% færre tokens" i evalueringer.
Den nye model er i øjeblikket tilgængelig i preview-tilstand via flere kanaler. Den rulles ud "i Google AI Studio (udviklere), Vertex AI (virksomheder) og Gemini-appen (alle)." Ifølge Googles I/O 2025-annonceringer vil den opdaterede version være "generelt tilgængelig i Google AI Studio for udviklere og i Vertex AI for virksomheder i begyndelsen af juni," mens Gemini 2.5 Pro følger "kort tid efter."
I takt med at Google fortsætter med at udvide sine AI-evner, markerer Gemini 2.5 Flash et betydeligt skridt fremad i at gøre avanceret ræsonnement mere tilgængeligt og omkostningseffektivt for både udviklere og brugere.