Ang Google DeepMind ay gumawa ng malaking hakbang tungo sa pagpapatalino at pagpapalaya ng mga robot sa pamamagitan ng paglulunsad ng Gemini Robotics On-Device, isang makapangyarihang AI system na ganap na tumatakbo sa mismong robot at hindi sa cloud.
Ipinakilala noong Hunyo 24, 2025, ang vision-language-action (VLA) model na ito ay isang mahalagang pag-unlad sa robotics AI dahil inaalis nito ang pangangailangan sa tuloy-tuloy na koneksyon sa internet. Ang teknolohiyang ito ay nakabatay sa Gemini Robotics platform ng Google na inilunsad noong Marso, na nagdala ng multimodal reasoning at pag-unawa sa totoong mundo sa mga makina sa pamamagitan ng Gemini 2.0 framework.
Kahit lokal na tumatakbo, ang on-device model ay nagpapakita ng kahanga-hangang kakayahan. Sa mga benchmark ng Google, ito ay nagpapamalas ng performance na halos kapantay ng cloud-based na Gemini Robotics model at mas mataas kaysa sa ibang on-device na alternatibo, lalo na sa mahihirap na out-of-distribution na gawain at komplikadong multi-step na mga tagubilin.
"Dahil ang model ay gumagana nang hindi umaasa sa data network, ito ay kapaki-pakinabang para sa mga aplikasyon na sensitibo sa latency, at tinitiyak ang tibay sa mga lugar na may putol-putol o walang konektibidad," ayon sa pahayag ng Google DeepMind.
Ipinapakita ng Gemini Robotics On-Device ang matibay na pangkalahatang liksi sa iba't ibang testing scenarios. Sa mga demonstrasyon, matagumpay na natapos ng mga robot na pinapagana ng model ang mga gawaing nangangailangan ng mataas na liksi tulad ng pagbubukas ng zipper ng bag at pagtiklop ng mga damit nang walang tulong mula sa cloud. Naiintindihan ng sistema ang mga natural na utos gamit ang wika at kaya nitong umangkop sa nagbabagong kapaligiran sa real-time.
Maglalabas din ang Google ng Gemini Robotics SDK upang tulungan ang mga developer na suriin at i-customize ang model. Kapansin-pansin, ito ang unang VLA model ng Google na maaaring i-fine-tune, kaya maaaring iangkop ng mga developer sa partikular na aplikasyon gamit lamang ang 50 hanggang 100 na demonstrasyon.
Bagama't orihinal na sinanay para sa ALOHA robots, naangkop na agad ng Google ang model para gumana sa iba pang platform, kabilang ang bi-arm Franka FR3 robot at ang Apollo humanoid robot ng Apptronik. Ipinapahiwatig ng versatility na ito ang malawak na potensyal na aplikasyon sa iba't ibang industriya mula sa pagmamanupaktura hanggang healthcare.
Ang pag-unlad na ito ay kasabay ng umiigting na kompetisyon sa AI-powered robotics, kung saan ang mga kumpanya tulad ng Nvidia, Hugging Face, at RLWRLD ay pawang gumagawa ng foundation models para sa mga robot. Tinutugunan ng on-device na diskarte ng Google ang isang kritikal na limitasyon sa larangan sa pamamagitan ng pagbibigay-daan sa mga robot na gumana nang epektibo sa mga lugar na hindi praktikal o imposibleng magkaroon ng cloud connectivity.