Google DeepMind направи значителна крачка към създаването на по-умни и независими роботи с пускането на Gemini Robotics On-Device – мощна AI система, която работи изцяло на самия робот, а не в облака.
Представен на 24 юни 2025 г., този модел от типа визия-език-действие (VLA) представлява сериозен напредък в роботиката, тъй като елиминира нуждата от постоянна интернет връзка. Технологията надгражда платформата Gemini Robotics, стартирана през март, която въведе мултимодално разсъждение и разбиране на реалния свят в машините чрез рамката Gemini 2.0.
Локалният модел демонстрира впечатляващи възможности, въпреки че работи локално. В тестовете на Google той се представя почти на нивото на облачния модел Gemini Robotics, като превъзхожда други локални алтернативи, особено при трудни задачи извън обучителното множество и сложни многоетапни инструкции.
„Тъй като моделът функционира независимо от мрежата за данни, той е полезен за приложения, чувствителни към закъснения, и гарантира устойчивост в среди с прекъсваща или липсваща свързаност“, заявиха от Google DeepMind в официалното съобщение.
Gemini Robotics On-Device показва силна универсална сръчност в различни тестови сценарии. В демонстрации, роботи, задвижвани от модела, успешно изпълняват задачи, изискващи висока сръчност, като разкопчаване на чанти и сгъване на дрехи – без помощ от облака. Системата разбира команди на естествен език и се адаптира в реално време към променяща се среда.
Google пуска и Gemini Robotics SDK, който да помогне на разработчиците да оценяват и персонализират модела. Забележително е, че това е първият VLA модел на Google, достъпен за фино настройване, което позволява на разработчиците да го адаптират към специфични приложения с едва 50 до 100 демонстрации.
Първоначално обучен за роботи ALOHA, моделът вече е адаптиран да работи и с други платформи, включително двурамковия робот Franka FR3 и хуманоидния робот Apollo на Apptronik. Тази гъвкавост подсказва за широки възможности за приложение – от производството до здравеопазването.
Развитието идва на фона на засилващата се конкуренция в областта на роботиката с изкуствен интелект, като компании като Nvidia, Hugging Face и RLWRLD също разработват основни модели за роботи. Локалният подход на Google адресира ключово ограничение в сферата, като позволява на роботите да функционират ефективно в среди, където облачната свързаност е непрактична или невъзможна.