Google heeft een preview-versie gelanceerd van Gemini 2.5 Flash, de nieuwste iteratie van zijn efficiënte AI-model dat prestaties, snelheid en kosteneffectiviteit in balans brengt.
Voortbouwend op de basis van Gemini 2.0 Flash, levert het nieuwe 2.5 Flash-model een grote upgrade op het gebied van redeneercapaciteiten, terwijl het zijn reputatie voor efficiëntie behoudt. Google omschrijft het als "een grote upgrade in redeneercapaciteiten, met behoud van prioriteit voor snelheid en kosten."
De opvallendste eigenschap van Gemini 2.5 Flash is het hybride redeneersysteem. Het is Google's "eerste volledig hybride redeneermodel, waarmee ontwikkelaars denken kunnen in- of uitschakelen en denkbudgetten kunnen instellen om de balans tussen kwaliteit, kosten en latentie te optimaliseren." Deze innovatieve aanpak geeft ontwikkelaars ongekende controle over hoe het model complexe taken verwerkt.
In de praktijk betekent dit dat ontwikkelaars een "denkbudget" kunnen specificeren dat bepaalt hoeveel redeneerwerk het model uitvoert. Ze kunnen "het aantal tokens dat een model mag genereren tijdens het denken" aanpassen van 0 tot 24.576 tokens via een schuifregelaar in Google AI Studio en Vertex AI, of via een API-parameter. Wanneer het denkbudget op nul staat, zijn de kosten en latentie gelijk aan die van Gemini 2.0 Flash.
De prijsstelling weerspiegelt deze flexibiliteit: invoertokens kosten 15 cent per miljoen en uitvoertokens 60 cent per miljoen zonder redeneercapaciteit. Met denkvermogen geactiveerd stijgen de kosten naar $3,50 per miljoen tokens.
Benchmarktests tonen indrukwekkende resultaten. Gemini 2.5 Flash "presteert sterk op Hard Prompts in LMArena, op één na beste na 2.5 Pro" en "heeft vergelijkbare metrics als andere toonaangevende modellen, maar dan voor een fractie van de kosten en omvang," en blijft "leiden als het model met de beste prijs-prestatieverhouding."
Google omschrijft 2.5 Flash als zijn "meest efficiënte werkpaardmodel, ontworpen voor snelheid en lage kosten," en merkt op dat het "verbeterd is op belangrijke benchmarks voor redeneren, multimodaliteit, code en lange context, terwijl het zelfs nog efficiënter is geworden, met 20-30% minder tokens" in evaluaties.
Het nieuwe model is momenteel in preview-modus beschikbaar via meerdere kanalen. Het wordt uitgerold "in Google AI Studio (ontwikkelaars), Vertex AI (bedrijven) en de Gemini-app (iedereen)." Volgens de aankondigingen op Google's I/O 2025 zal de bijgewerkte versie "algemeen beschikbaar zijn in Google AI Studio voor ontwikkelaars en in Vertex AI voor bedrijven begin juni," met Gemini 2.5 Pro die "kort daarna volgt."
Terwijl Google zijn AI-mogelijkheden verder uitbreidt, betekent Gemini 2.5 Flash een belangrijke stap vooruit in het toegankelijker en kostenefficiënter maken van geavanceerd redeneren voor zowel ontwikkelaars als gebruikers.