Google DeepMind radi na transformaciji svog najnaprednijeg multimodalnog temeljnog modela, Gemini 2.5 Pro, u ono što naziva 'modelom svijeta' – AI sustav sposobnog razumjeti i simulirati aspekte stvarnog svijeta na način koji oponaša ljudske kognitivne procese.
Ova ambiciozna inicijativa, najavljena na Google I/O 2025, ima za cilj stvoriti umjetnu inteligenciju koja može planirati i zamišljati nova iskustva modeliranjem načina na koji svijet funkcionira. Prema riječima izvršnog direktora DeepMinda, Demisa Hassabisa, ova sposobnost predstavlja temeljni napredak u umjetnoj inteligenciji koji nadilazi jednostavnu klasifikaciju i predviđanje.
"Zbog toga radimo na proširenju našeg najboljeg multimodalnog temeljnog modela, Gemini 2.5 Pro, kako bi postao 'model svijeta' koji može planirati i zamišljati nova iskustva razumijevanjem i simuliranjem aspekata svijeta, baš kao što to čini ljudski mozak," objasnio je Hassabis u nedavnoj objavi na blogu.
Google već vidi rane dokaze ovih sposobnosti modeliranja svijeta u Gemini modelu kroz mogućnost predstavljanja i simulacije prirodnih okruženja, razumijevanja intuitivne fizike putem svog Veo modela te podučavanja robota kako da hvataju predmete i slijede upute kroz Gemini Robotics.
Tvrtka ovaj razvoj opisuje kao ključni korak prema stvaranju "univerzalnog AI asistenta" – inteligentnog sustava koji razumije kontekst te može planirati i djelovati na bilo kojem uređaju. Googleova krajnja vizija je transformirati Gemini aplikaciju u asistenta koji može obavljati svakodnevne zadatke, upravljati administrativnim poslovima i pružati personalizirane preporuke.
Ova sposobnost modela svijeta nadograđuje se na već impresivne mogućnosti zaključivanja Gemini 2.5 Pro modela. Model trenutno prednjači na testovima iz složene matematike, znanosti i programiranja, te zauzima prvo mjesto na ljestvicama LMArena i WebDev Arena, koje mjere ljudske preferencije u interakciji s AI sustavima.
Google planira integrirati ove mogućnosti modela svijeta s tehnologijama iz Project Mariner i Project Astra, koji su fokusirani na višezadaćnost i vizualno razumijevanje. Unaprijeđeni Gemini 2.5 Pro očekuje se u širokoj dostupnosti u lipnju 2025., nakon trenutne faze testiranja.