menu
close

Google breidt Gemini 2.5-familie uit met ultra-efficiënte Flash-Lite

Google heeft de Gemini 2.5-familie uitgebreid door Gemini 2.5 Flash en Pro algemeen beschikbaar te maken, en introduceert 2.5 Flash-Lite als preview – hun meest kostenefficiënte en snelste 2.5-model tot nu toe. Flash-Lite is een redeneermodel dat is geoptimaliseerd voor kosten en snelheid, waarbij 'denken' standaard is uitgeschakeld. Dit biedt een nog goedkopere optie voor toepassingen die gevoelig zijn voor latentie en minder modelintelligentie vereisen. Ondertussen is Gemini 2.5 Pro het toonaangevende model geworden op de WebDev Arena- en LMArena-ranglijsten, wat de voortdurende AI-vooruitgang van Google onderstreept.
Google breidt Gemini 2.5-familie uit met ultra-efficiënte Flash-Lite

Google heeft aangekondigd dat Gemini 2.5 Flash en 2.5 Pro nu stabiel en algemeen beschikbaar zijn, waardoor organisaties de betrouwbaarheid en schaalbaarheid krijgen die nodig zijn om geavanceerde AI-mogelijkheden met vertrouwen in bedrijfskritische toepassingen te implementeren. Tegelijkertijd heeft het bedrijf Gemini 2.5 Flash-Lite als preview geïntroduceerd, die wordt omschreven als hun meest kostenefficiënte en snelste 2.5-model tot nu toe.

Gemini 2.5 Flash-Lite is een redeneermodel dat dynamische controle over het denkbudget mogelijk maakt via een API-parameter. In tegenstelling tot andere modellen in de 2.5-familie is Flash-Lite geoptimaliseerd voor kosten en snelheid, waarbij 'denken' standaard is uitgeschakeld. Ondanks deze optimalisaties ondersteunt het alle native tools, waaronder Grounding met Google Search, code-uitvoering en URL-context, naast functie-aanroepen.

Flash-Lite levert betere prestaties dan het vorige Flash-Lite-model en is 1,5 keer sneller dan 2.0 Flash tegen lagere kosten. Het is specifiek ontworpen voor grootschalige, latentiegevoelige taken zoals vertaling, classificatie, intelligente routering en andere kostenbewuste, grootschalige operaties. Het model presteert aanzienlijk beter dan 2.0 Flash-Lite op benchmarks voor coderen, wiskunde, wetenschap, redeneren en multimodale taken, waardoor het ideaal is voor grootschalige toepassingen.

Net als andere modellen in de Gemini 2.5-familie beschikt Flash-Lite over mogelijkheden die het nuttig maken, zoals het kunnen inschakelen van denken op verschillende budgetten, koppelingen naar tools als Grounding met Google Search en code-uitvoering, multimodale input en een contextlengte van 1 miljoen tokens. Om te zorgen dat antwoorden actueel en feitelijk zijn, kan Flash-Lite Google Search als ingebouwde tool gebruiken en intelligent bepalen wanneer Search nodig is om zijn kennis aan te vullen.

Naast de introductie van Flash-Lite heeft Google aangekondigd dat Gemini 2.5 Pro het toonaangevende model is geworden op de WebDev Arena- en LMArena-ranglijsten. Met een ELO-score van 1415 op de WebDev Arena-coderingsranglijst voert het alle ranglijsten aan in LMArena, dat menselijke voorkeuren in meerdere dimensies meet. Daarnaast heeft Google LearnLM direct geïntegreerd in Gemini 2.5, waarmee het het toonaangevende model ter wereld is geworden op het gebied van leren. Volgens hun laatste rapport presteerde Gemini 2.5 Pro beter dan concurrenten op elk gebied van leerwetenschappelijke principes, waarbij onderwijsdeskundigen en pedagogische experts het model verkozen boven andere opties in uiteenlopende leerscenario's.

Gemini 2.5 Flash-Lite is nu als preview beschikbaar in Google AI Studio en Vertex AI, naast de stabiele versies van 2.5 Flash en Pro. Ontwikkelaars kunnen het model (gemini-2.5-flash-lite-preview-06-17) benaderen via de Google Gen AI SDK, die een uniforme interface biedt naar de Gemini 2.5-modelfamilie via zowel de Gemini Developer API als de Vertex AI Gemini API.

Source:

Latest News