Isang malaking hakbang ang ginawa ng Google DeepMind upang dalhin ang makabagong kakayahan ng AI sa mga pisikal na robot sa pamamagitan ng paglulunsad ng Gemini Robotics On-Device, isang modelong idinisenyo upang tumakbo nang buo sa lokal na hardware ng robot.
Ang bagong sistemang ito, na inanunsyo noong huling bahagi ng Hunyo 2025, ay nakabatay sa Gemini Robotics platform na unang ipinakilala noong Marso at nagdala ng multimodal reasoning ng Gemini 2.0 sa pisikal na mundo. Ang nagpapabago sa pinakabagong bersyon na ito ay ang kakayahan nitong gumana nang hindi umaasa sa koneksyon sa cloud habang nananatiling mataas ang antas ng performance.
"Ipinapakita ng Gemini Robotics On-Device ang malakas na general-purpose dexterity at kakayahang mag-generalize ng mga gawain, at ito ay na-optimize upang tumakbo nang episyente sa mismong robot," ayon sa opisyal na pahayag ng Google DeepMind. Ang pagiging independyente nito sa network connectivity ay lalong mahalaga para sa mga aplikasyon na sensitibo sa latency at sa mga lugar na may pabago-bagong o walang koneksyon.
Sa mga benchmark test, sinasabi ng Google na ang on-device model ay nagpe-perform nang halos kasinggaling ng cloud-based na bersyon nito at mas mahusay kumpara sa ibang on-device na alternatibo, lalo na sa mahihirap na out-of-distribution na gawain at komplikadong multi-step na mga instruksiyon.
Ipinapakita ng model ang pambihirang kakayahang umangkop, na nangangailangan lamang ng 50-100 na demonstrasyon upang matutunan ang mga bagong gawain. Bagama't orihinal na sinanay para sa mga ALOHA robot, matagumpay itong naangkop ng Google upang gumana sa mga bi-arm Franka FR3 robot at sa Apollo humanoid robot ng Apptronik, na nagpapakita ng versatility nito sa iba't ibang robotic platforms.
Kasabay ng model, maglalabas din ang Google ng Gemini Robotics SDK upang matulungan ang mga developer na suriin at i-customize ang teknolohiya para sa kanilang partikular na aplikasyon. Pinapayagan ng SDK ang pagsubok sa MuJoCo physics simulator ng Google at nagbibigay ng mga tool para sa mabilisang pag-angkop sa mga bagong domain.
Ang pag-unlad na ito ay isang malaking hakbang sa praktikal na robotics sa pamamagitan ng direktang pagdadala ng sopistikadong AI sa mga robotic device. Bagama't maaaring ilang taon pa bago ito maging available sa mga consumer, nakikita ni Carolina Parada, pinuno ng robotics sa Google DeepMind, ang malawak na potensyal nito: "Maaaring mas maging kapaki-pakinabang ito sa mga industriya kung saan komplikado ang setup, mahalaga ang precision, at hindi akma para sa tao ang mga lugar. At maaari rin itong makatulong sa mga espasyong nakasentro sa tao, tulad ng tahanan."