Google DeepMind зробила значний крок до створення розумніших і незалежніших роботів, анонсувавши 24 червня 2025 року випуск Gemini Robotics On-Device.
Нова модель є суттєвим проривом у сфері робототехнічного ШІ, дозволяючи роботам працювати без підключення до хмари, зберігаючи при цьому вражаючі можливості. На відміну від попередника, представленого у березні, Gemini Robotics On-Device повністю функціонує на локальному обладнанні робота, усуваючи необхідність постійного доступу до інтернету й забезпечуючи продуктивність, порівнянну з хмарними рішеннями.
«Оскільки модель працює незалежно від мережі передачі даних, це корисно для застосувань, чутливих до затримок, і гарантує надійність у середовищах з нестабільним або відсутнім підключенням», — зазначили у Google DeepMind.
Технологія демонструє вражаючу спритність і адаптивність, дозволяючи роботам виконувати складні завдання, що потребують тонкої моторики. На демонстраціях роботи на основі цієї моделі успішно виконували такі складні операції, як складання одягу, розстібання сумок і точні промислові збірки.
Разом із моделлю Google випускає SDK Gemini Robotics, який дозволяє розробникам оцінювати та налаштовувати систему під конкретні завдання. SDK дає змогу навчати роботів новим діям на основі всього 50–100 демонстрацій із використанням фізичного симулятора MuJoCo. Хоча спочатку модель навчали для роботів ALOHA, Google успішно адаптувала її для інших платформ, зокрема дворукого робота Franka FR3 та людиноподібного робота Apollo від Apptronik.
Розробка відбувається на тлі загострення конкуренції у сфері робототехнічного ШІ, де такі компанії, як NVIDIA та Hugging Face, також створюють базові моделі для роботів. Локальний підхід Google вирішує критично важливі проблеми впровадження робототехніки, зокрема питання конфіденційності та роботи в умовах обмеженого підключення.
Розробники, які зацікавлені у роботі з Gemini Robotics On-Device, можуть подати заявку на участь у програмі Google для довірених тестувальників, щоб отримати доступ до моделі та SDK.