Google DeepMind napravio je značajan korak prema pametnijim i neovisnijim robotima predstavljanjem Gemini Robotics On-Device, snažnog AI sustava koji radi u potpunosti na samom robotu, a ne u oblaku.
Predstavljen 24. lipnja 2025., ovaj model vizija-jezik-akcija (VLA) predstavlja velik napredak u robotskoj umjetnoj inteligenciji jer uklanja potrebu za stalnom internetskom povezanošću. Tehnologija se temelji na Googleovoj Gemini Robotics platformi lansiranoj u ožujku, koja je kroz Gemini 2.0 okvir donijela multimodalno zaključivanje i razumijevanje stvarnog svijeta strojevima.
Model na uređaju pruža impresivne mogućnosti unatoč lokalnom radu. Prema Googleovim testiranjima, njegova učinkovitost je bliska modelu Gemini Robotics temeljenom na oblaku, a nadmašuje druge modele na uređaju, osobito kod zahtjevnih zadataka izvan distribucije i složenih višekorakih uputa.
"Budući da model radi neovisno o podatkovnoj mreži, koristan je za aplikacije osjetljive na latenciju i osigurava robusnost u okruženjima s povremenom ili nikakvom povezanošću", naveli su iz Google DeepMinda u svojoj objavi.
Gemini Robotics On-Device pokazuje snažnu svestranu spretnost u raznim testnim scenarijima. U demonstracijama, roboti pokretani ovim modelom uspješno su izvodili vrlo zahtjevne zadatke poput otvaranja patentnih zatvarača na torbama i slaganja odjeće bez pomoći oblaka. Sustav razumije prirodne jezične naredbe i prilagođava se promjenjivim okruženjima u stvarnom vremenu.
Google također objavljuje Gemini Robotics SDK kako bi pomogao developerima u evaluaciji i prilagodbi modela. Posebno je važno što je ovo prvi VLA model koji Google omogućuje za fino podešavanje, što developerima omogućuje prilagodbu za specifične primjene uz svega 50 do 100 demonstracija.
Model je u početku treniran za ALOHA robote, ali Google ga je već prilagodio za rad na drugim platformama, uključujući dvoručnog robota Franka FR3 i humanoidnog robota Apollo tvrtke Apptronik. Ova svestranost sugerira široku primjenu u industrijama od proizvodnje do zdravstva.
Ovaj razvoj dolazi u trenutku kada se konkurencija na polju robotske umjetne inteligencije pojačava, a tvrtke poput Nvidije, Hugging Facea i RLWRLD-a rade na temeljima modela za robote. Googleov pristup na uređaju rješava ključno ograničenje u području omogućujući robotima učinkovito funkcioniranje u okruženjima gdje je povezivost s oblakom nepraktična ili nemoguća.