Google transformeert zijn meest geavanceerde AI-model, Gemini 2.5 Pro, tot wat het een 'wereldmodel' noemt – een systeem dat aspecten van de werkelijkheid kan begrijpen en simuleren op een manier die de werking van het menselijk brein weerspiegelt.
Volgens recente aankondigingen van Google DeepMind tijdens Google I/O 2025, zal deze wereldmodel-capaciteit Gemini in staat stellen plannen te maken en nieuwe ervaringen te verbeelden door aspecten van de wereld te begrijpen en te simuleren. Dit betekent een grote evolutie in het vermogen van AI om te redeneren over en te interageren met complexe omgevingen.
"Daarom werken we eraan om ons beste multimodale foundationmodel, Gemini 2.5 Pro, uit te breiden tot een 'wereldmodel' dat plannen kan maken en nieuwe ervaringen kan verbeelden door aspecten van de wereld te begrijpen en te simuleren, net zoals het brein dat doet," aldus Google in zijn officiële blog.
De wereldmodelbenadering bouwt voort op Google's uitgebreide onderzoek naar het trainen van AI-agenten om complexe spellen te beheersen en interactieve simulaties te creëren. Bewijs van deze capaciteiten is nu al zichtbaar in Gemini's vermogen om wereldkennis en redeneervermogen te gebruiken om natuurlijke omgevingen te representeren, intuïtieve natuurkunde te begrijpen en robots te leren instructies op te volgen en zich direct aan te passen.
Centraal in deze evolutie staat de nieuwe Deep Think-functie, een experimentele, verbeterde redeneermodus voor Gemini 2.5 Pro. Deep Think stelt het model in staat om meerdere hypothesen te overwegen voordat het antwoordt, wat de prestaties bij complexe wiskunde- en programmeertaken aanzienlijk verbetert. De functie heeft al indrukwekkende scores behaald op uitdagende benchmarks zoals de USAMO-wiskundewedstrijd van 2025 en LiveCodeBench voor programmeren.
Gemini 2.5 Pro met Deep Think is momenteel beschikbaar voor vertrouwde testers via de Gemini API, waarbij Google aanvullende veiligheidsevaluaties uitvoert voordat het model breder wordt uitgerold. Ondertussen wordt verwacht dat het standaardmodel van Gemini 2.5 Pro algemeen beschikbaar zal zijn tegen eind juni 2025, na de eerdere release van Gemini 2.5 Flash.
Deze vooruitgang richting wereldmodellering maakt deel uit van Google's bredere visie om een universele AI-assistent te creëren die context kan begrijpen, effectief kan plannen en actie kan ondernemen op verschillende apparaten – en zo de manier waarop mensen met AI-systemen omgaan fundamenteel te veranderen.