Google DeepMind通过发布Gemini Robotics On-Device,迈出了将先进AI能力引入实体机器人的重要一步。这一模型专为在本地机器人硬件上完全独立运行而设计。
新系统于2025年6月底正式发布,基于今年3月推出的Gemini Robotics平台,首次将Gemini 2.0的多模态推理能力带入物理世界。此次发布的最大突破在于,模型能够在无需云端连接的情况下独立运行,同时保持出色的性能表现。
根据Google DeepMind官方公告,“Gemini Robotics On-Device展现出强大的通用灵巧性和任务泛化能力,并针对机器人本地运行进行了高效优化。”这种对网络连接的独立性,使其在对延迟敏感或网络不稳定甚至无网络的环境中具有特别重要的应用价值。
在基准测试中,Google表示本地端模型的表现接近其云端版本,并在面对复杂的分布外任务和多步骤指令时,优于其他本地端替代方案。
该模型展现出极强的适应性,仅需50至100次演示即可学习新任务。虽然最初为ALOHA机器人训练,Google已成功将其适配至双臂Franka FR3机器人和Apptronik的Apollo人形机器人,充分展示了其在不同机器人平台上的通用性。
与此同时,Google还发布了Gemini Robotics SDK,帮助开发者评估并定制该技术以适应特定应用场景。该SDK支持在Google的MuJoCo物理仿真器中进行测试,并提供了快速适应新领域的工具。
这一进展将先进AI能力直接带到机器人设备上,标志着实用机器人技术的重大突破。尽管面向消费者的应用可能还需数年时间,Google DeepMind机器人负责人Carolina Parada认为其潜力巨大:“它们在设置复杂、对精度要求高且不适合人类工作的工业场景中将更有用,同时也可能在以人为中心的空间,如家庭中发挥作用。”