Binabago ng Google ang kanilang pinaka-advanced na AI model, ang Gemini 2.5 Pro, upang maging tinatawag nilang 'modelo ng mundo'—isang sistema na kayang umunawa at magsimula ng mga aspeto ng realidad sa paraang ginagaya ang paggana ng utak ng tao.
Ayon sa mga pinakahuling anunsyo ng Google DeepMind sa Google I/O 2025, ang kakayahang ito ng modelo ng mundo ay magbibigay-daan sa Gemini na makagawa ng mga plano at maglarawan ng mga bagong karanasan sa pamamagitan ng pag-unawa at pagsisimula ng mga aspeto ng mundo. Ito ay isang malaking hakbang sa kakayahan ng AI na mag-isip at makipag-ugnayan sa masalimuot na mga kapaligiran.
"Ito ang dahilan kung bakit pinapalawak namin ang aming pinakamahusay na multimodal foundation model, ang Gemini 2.5 Pro, upang maging isang 'modelo ng mundo' na kayang magplano at maglarawan ng mga bagong karanasan sa pamamagitan ng pag-unawa at pagsisimula ng mga aspeto ng mundo, tulad ng ginagawa ng utak," ayon sa opisyal na blog ng Google.
Ang approach na modelo ng mundo ay nakabatay sa malawak na pananaliksik ng Google sa pagsasanay ng mga AI agent upang magtagumpay sa mga komplikadong laro at lumikha ng mga interactive na simulation. Makikita na ang ebidensya ng mga kakayahang ito sa Gemini, kabilang ang paggamit ng kaalaman sa mundo at pangangatwiran upang ilarawan ang mga natural na kapaligiran, umunawa ng intuitive physics, at turuan ang mga robot na sumunod sa mga tagubilin at mag-adapt nang mabilis.
Sentro ng ebolusyong ito ang bagong Deep Think feature, isang eksperimento sa pinalakas na mode ng pangangatwiran para sa Gemini 2.5 Pro. Pinapahintulutan ng Deep Think ang modelo na isaalang-alang ang maraming hypothesis bago tumugon, na malaki ang naitutulong sa performance nito sa komplikadong mga task sa matematika at pagko-code. Nakamit na ng feature na ito ang mataas na marka sa mahihirap na benchmark tulad ng 2025 USAMO math competition at LiveCodeBench para sa coding.
Ang Gemini 2.5 Pro na may Deep Think ay kasalukuyang available sa mga pinagkakatiwalaang tester sa pamamagitan ng Gemini API, habang nagsasagawa pa ang Google ng karagdagang safety evaluations bago ito ilabas sa mas malawak na publiko. Samantala, inaasahang magiging available sa lahat ang standard na Gemini 2.5 Pro model pagsapit ng huling bahagi ng Hunyo 2025, kasunod ng naunang paglabas ng Gemini 2.5 Flash.
Ang pagsulong na ito patungo sa world modeling ay bahagi ng mas malawak na bisyon ng Google na lumikha ng isang unibersal na AI assistant na kayang umunawa ng konteksto, magplano nang epektibo, at magsagawa ng aksyon sa iba't ibang device—na sa huli ay magbabago sa paraan ng pakikipag-ugnayan ng tao sa mga AI system.