Googleは、最先端AIモデルであるGemini 2.5 Proを「ワールドモデル」へと進化させている。これは、人間の脳の働きを模倣する形で、現実のさまざまな側面を理解し、シミュレーションできるシステムである。
Google DeepMindがGoogle I/O 2025で発表したところによると、このワールドモデル機能により、Geminiは世界の側面を理解・シミュレーションすることで計画を立てたり、新たな体験を想像したりできるようになる。これは、AIが複雑な環境を推論し、相互作用できる能力における大きな進化を意味する。
Googleは公式ブログで「私たちは、最高のマルチモーダル基盤モデルであるGemini 2.5 Proを、脳と同じように世界の側面を理解しシミュレーションすることで計画を立て、新たな体験を想像できる『ワールドモデル』へと拡張するために取り組んでいます」と述べている。
ワールドモデルのアプローチは、Googleがこれまで積み重ねてきた、AIエージェントに複雑なゲームを習得させたり、インタラクティブなシミュレーションを作成したりする研究の成果に基づいている。Geminiが世界の知識や推論を用いて自然環境を表現したり、直感的な物理法則を理解したり、ロボットに指示を与えて即座に適応させたりする能力にも、すでにその片鱗が見られる。
この進化の中心となるのが、新たに導入された「Deep Think」機能だ。これはGemini 2.5 Pro向けの実験的な強化推論モードであり、複数の仮説を検討してから応答することで、複雑な数学やコーディングの課題における性能を大幅に向上させている。この機能は、2025年のUSAMO数学コンテストやLiveCodeBenchなどの難関ベンチマークでも優れたスコアを記録している。
Deep Thinkを搭載したGemini 2.5 Proは、現在信頼できるテスター向けにGemini API経由で提供されており、Googleは一般公開前に追加の安全性評価を実施している。一方、標準のGemini 2.5 Proモデルは、先行リリースされたGemini 2.5 Flashに続き、2025年6月末までに一般提供が開始される見込みだ。
このワールドモデルへの進化は、文脈を理解し、効果的に計画し、複数のデバイスを横断して行動できるユニバーサルAIアシスタントの実現という、Googleのより広範なビジョンの一部である。最終的には、人間とAIシステムの関わり方そのものを変革することが期待されている。