menu
close

Google introduceert ultra-efficiënte Gemini 2.5 Flash-Lite voor kostenbewuste AI

Op 15 juli 2025 heeft Google zijn Gemini 2.5-familie uitgebreid met de officiële lancering van Flash-Lite, het meest kostenefficiënte en snelste model in de 2.5-serie. Deze introductie valt samen met de algemene beschikbaarheid van Gemini 2.5 Flash en Pro voor alle gebruikers. Flash-Lite is ontworpen om superieure prestaties te leveren bij taken met hoge doorvoer, terwijl het de laagste latentie en kosten binnen de Gemini 2.5-reeks behoudt.
Google introduceert ultra-efficiënte Gemini 2.5 Flash-Lite voor kostenbewuste AI

Google heeft officieel Gemini 2.5 Flash-Lite gelanceerd, wat een belangrijke stap betekent in het toegankelijker en efficiënter maken van krachtige AI voor zowel ontwikkelaars als bedrijven.

Het nieuwe model, door Google omschreven als 'het meest kostenefficiënte en snelste 2.5-model tot nu toe', is geoptimaliseerd voor grootschalige, latentiegevoelige toepassingen. Flash-Lite betreedt de markt met de laagste latentie en kosten binnen de 2.5-modelfamilie en is ontworpen als een voordelige upgrade ten opzichte van eerdere 1.5- en 2.0-Flash-modellen. Het biedt betere prestaties bij de meeste evaluaties, met een kortere tijd tot de eerste token en een hogere tokens-per-seconde-decodeersnelheid. Hierdoor is het ideaal voor taken met hoge doorvoer, zoals grootschalige classificatie of samenvatting.

Als redeneermodel maakt Flash-Lite het mogelijk om het denkbudget dynamisch te regelen via een API-parameter. In tegenstelling tot andere Gemini 2.5-modellen, waar denken standaard is ingeschakeld, optimaliseert Flash-Lite voor kosten en snelheid door denken uitgeschakeld te laten, tenzij dit expliciet wordt geactiveerd. Ondanks deze optimalisatie ondersteunt het nog steeds alle native tools, waaronder Google Search-grounding, code-uitvoering, URL-context en functie-aanroepen.

Uit prestatietests blijkt dat Flash-Lite 1,5 keer sneller is dan Gemini 2.0 Flash tegen lagere kosten, waardoor het bijzonder geschikt is voor taken zoals classificatie, vertaling, intelligente routering en andere kostenbewuste, grootschalige toepassingen. Waar andere modellen standaard krachtigere (en duurdere) redeneertools gebruiken om vragen te beantwoorden, geeft Flash-Lite ontwikkelaars controle over dit proces. Gebruikers kunnen de denkmogelijkheid aan- of uitzetten, afhankelijk van hun specifieke behoeften. Ondanks de kostenefficiëntie is Flash-Lite niet beperkt in zijn mogelijkheden.

De preview van Gemini 2.5 Flash-Lite is nu beschikbaar in Google AI Studio en Vertex AI, naast de stabiele versies van 2.5 Flash en Pro. Beide, 2.5 Flash en Pro, zijn ook toegankelijk in de Gemini-app, en Google heeft aangepaste versies van 2.5 Flash-Lite en Flash naar Search gebracht.

Deze strategische uitbreiding van de Gemini-modelfamilie onderstreept Google's inzet om AI te democratiseren door opties te bieden die prestaties, kosten en snelheid in balans brengen voor uiteenlopende toepassingen, van complexe redeneervraagstukken tot grootschalige dataverwerking.

Source:

Latest News