Google DeepMind sedang berusaha untuk mengubah model asas multimodal paling maju mereka, Gemini 2.5 Pro, menjadi apa yang mereka gelar sebagai 'model dunia' – satu sistem AI yang mampu memahami dan mensimulasikan aspek dunia sebenar dengan cara yang meniru proses kognitif manusia.
Inisiatif berwawasan ini diumumkan pada Google I/O 2025, dengan matlamat untuk mencipta AI yang boleh merancang dan membayangkan pengalaman baharu melalui pemodelan cara dunia berfungsi. Menurut Ketua Pegawai Eksekutif DeepMind, Demis Hassabis, keupayaan ini mewakili kemajuan asas dalam kecerdasan buatan yang melangkaui sekadar pengelasan dan ramalan mudah.
"Inilah sebabnya kami berusaha untuk memperluaskan model asas multimodal terbaik kami, Gemini 2.5 Pro, agar menjadi 'model dunia' yang boleh merancang dan membayangkan pengalaman baharu dengan memahami serta mensimulasikan aspek dunia, sama seperti otak manusia," jelas Hassabis dalam satu catatan blog baru-baru ini.
Google telah melihat bukti awal keupayaan pemodelan dunia ini muncul dalam keupayaan Gemini untuk mewakili dan mensimulasikan persekitaran semula jadi, memahami fizik intuitif melalui model Veo, serta mengajar robot untuk memegang objek dan mengikut arahan melalui Gemini Robotics.
Syarikat itu menyifatkan pembangunan ini sebagai langkah kritikal ke arah penciptaan "pembantu AI sejagat" – satu sistem pintar yang memahami konteks serta mampu merancang dan bertindak merentasi mana-mana peranti. Visi utama Google adalah untuk mengubah aplikasi Gemini menjadi pembantu yang boleh melaksanakan tugas harian, mengurus kerja pentadbiran, dan memberikan cadangan peribadi.
Keupayaan model dunia ini dibina di atas kebolehan penaakulan Gemini 2.5 Pro yang sudah mengagumkan. Model ini kini mendahului penanda aras untuk tugas matematik, sains, dan pengekodan yang kompleks, serta berada di tangga teratas papan pendahulu LMArena dan WebDev Arena, yang mengukur keutamaan manusia terhadap interaksi AI.
Google merancang untuk mengintegrasikan keupayaan model dunia ini dengan teknologi daripada Project Mariner dan Project Astra, yang masing-masing memfokuskan kepada pelbagai tugasan dan pemahaman visual. Gemini 2.5 Pro yang dipertingkatkan dijangka akan tersedia secara umum pada Jun 2025, selepas fasa pratonton semasa.