Google mengambil langkah besar dalam kecerdasan buatan dengan mengembangkan Gemini 2.5 Pro menjadi 'model dunia' komprehensif yang dapat memahami dan mensimulasikan aspek realitas secara mirip dengan cara kerja kognisi manusia.
Model dunia merepresentasikan perubahan mendasar dalam kemampuan AI, melampaui pemrosesan bahasa untuk menciptakan representasi internal lingkungan fisik. Konsep ini berfokus pada bagaimana agen cerdas dapat memahami dan memodelkan lingkungan interaktif eksternal untuk meningkatkan kemampuan pengambilan keputusan dan perencanaan mereka. Awalnya dikembangkan untuk memodelkan interaksi fisik tingkat rendah, model dunia kini berkembang ke simulasi dunia nyata dan pembuatan lingkungan kompleks yang realistis.
Sistem AI canggih ini mensimulasikan lingkungan dunia nyata dengan memanfaatkan dataset multimodal yang luas, termasuk gambar, audio, video, dan teks. Kemampuan ini memungkinkan AI memprediksi hasil dari berbagai tindakan, meningkatkan kemampuan penalaran dan perencanaan. Model dunia secara efektif menjembatani kesenjangan antara data mentah dan wawasan yang dapat ditindaklanjuti, memfasilitasi interaksi yang lebih intuitif antara mesin dan lingkungannya.
Google mengumumkan sedang berupaya mengembangkan Gemini 2.5 Pro menjadi model dunia "yang dapat membuat rencana dan membayangkan pengalaman baru dengan memahami dan mensimulasikan aspek dunia, seperti halnya otak manusia." Perkembangan ini menandai kemajuan signifikan dalam strategi AI Google, yang berpotensi memungkinkan pemecahan masalah yang lebih canggih di berbagai bidang.
Selain evolusi ambisius ini, Google juga membagikan beberapa pembaruan pada keluarga model Gemini. Gemini 2.5 Flash kini tersedia untuk semua orang di aplikasi Gemini, dengan versi terbaru akan tersedia secara umum di Google AI Studio untuk pengembang dan di Vertex AI untuk perusahaan pada awal Juni, diikuti oleh Gemini 2.5 Pro.
Gemini 2.5 Pro akan ditingkatkan dengan Deep Think, mode penalaran eksperimental yang dirancang untuk tugas matematika dan pemrograman yang sangat kompleks. Google juga menghadirkan kemampuan baru pada kedua model, termasuk perlindungan keamanan tingkat lanjut. Pendekatan keamanan terbaru mereka secara signifikan meningkatkan perlindungan terhadap serangan injeksi prompt tidak langsung saat penggunaan alat, menjadikan keluarga Gemini 2.5 sebagai seri model teraman mereka hingga saat ini.
Perkembangan ini hadir di tengah persaingan yang semakin ketat di ranah AI, dengan perusahaan seperti Nvidia dan startup seperti World Labs juga mengembangkan teknologi model dunia. Jika model bahasa besar adalah inti sistem seperti ChatGPT, maka model dunia adalah fondasi simulator dunia virtual yang dibutuhkan untuk melatih robot dan sistem AI lainnya. Alat-alat ini dapat menghasilkan lingkungan dan simulasi 3D yang membantu robot memahami, merencanakan, dan menavigasi lingkungan mereka dengan lebih baik.
Seiring Google terus mendorong batas kemampuan AI, evolusi Gemini 2.5 Pro menjadi model dunia menandai era baru di mana kecerdasan buatan tidak hanya dapat memproses informasi, tetapi juga memahami, memprediksi, dan berinteraksi dengan dunia secara semakin mirip manusia.