Google DeepMindは、先進的なAI機能を物理ロボットにもたらす大きな一歩として、ローカルのロボットハードウェア上で完全に動作するモデル「Gemini Robotics On-Device」を発表しました。
この新システムは2025年6月下旬に発表され、3月に導入されたGemini Roboticsプラットフォームを基盤としています。Gemini 2.0のマルチモーダル推論を物理世界に持ち込んだこのプラットフォームに対し、今回のオンデバイス版は、クラウド接続なしで高いパフォーマンスを維持できる点が画期的です。
Google DeepMindの公式発表によれば、「Gemini Robotics On-Deviceは、汎用的な器用さとタスクの一般化に優れ、ロボット本体で効率的に動作するよう最適化されています」。このネットワーク非依存性により、低遅延が求められる用途や、接続が不安定または全くない環境で特に有用となります。
ベンチマークテストでは、オンデバイスモデルはクラウド版に近い性能を発揮し、特に未知のタスクや複雑なマルチステップ指示において、他のオンデバイス型AIを上回る結果を示しました。
このモデルは高い適応力を持ち、新しいタスクの習得に50~100回のデモンストレーションしか必要としません。当初はALOHAロボット向けに訓練されていましたが、Googleは二腕型Franka FR3ロボットやApptronik社のヒューマノイドロボット「Apollo」への適用にも成功し、さまざまなロボットプラットフォームでの汎用性を実証しています。
また、Googleは開発者向けにGemini Robotics SDKも公開し、技術の評価やカスタマイズを支援します。SDKはGoogleの物理シミュレータ「MuJoCo」でのテストが可能で、新たな領域への迅速な適応を支援するツールも提供されます。
この開発は、高度なAIをロボットデバイスに直接搭載することで、実用ロボティクス分野における大きな前進となります。消費者向け応用はまだ数年先と見られますが、Google DeepMindのロボティクス責任者Carolina Parada氏は「複雑なセットアップや高精度が求められ、人間にとって扱いにくい環境の産業分野で特に有用となるでしょう。また、家庭など人間中心の空間でも役立つ可能性があります」と展望を語っています。