Google DeepMind učinil významný krok směrem k chytřejším a samostatnějším robotům díky uvedení Gemini Robotics On-Device, výkonného AI systému, který běží zcela na samotném robotovi a nevyžaduje cloudové zpracování.
Nový model typu vision-language-action (VLA), představený 24. června 2025, znamená zásadní pokrok v oblasti robotické AI, protože eliminuje potřebu stálého internetového připojení. Technologie staví na platformě Gemini Robotics, kterou Google spustil v březnu a která přinesla strojům multimodální uvažování a porozumění reálnému světu prostřednictvím frameworku Gemini 2.0.
I přes lokální provoz nabízí on-device model působivé schopnosti. Podle měření Googlu dosahuje výkonu blízkého cloudové verzi Gemini Robotics a překonává ostatní lokální alternativy, zejména při náročných úlohách mimo tréninková data a při komplexních vícekrokových instrukcích.
„Protože model funguje nezávisle na datové síti, je vhodný pro aplikace citlivé na latenci a zajišťuje robustnost v prostředích s přerušovaným nebo nulovým připojením,“ uvedl Google DeepMind ve svém oznámení.
Gemini Robotics On-Device prokazuje silnou univerzální obratnost v různých testovacích scénářích. V ukázkách roboti pohánění tímto modelem úspěšně zvládli vysoce obratné úkoly, jako je rozepínání tašek nebo skládání oblečení, a to bez cloudové asistence. Systém rozumí přirozeným jazykovým příkazům a dokáže se v reálném čase přizpůsobovat měnícím se podmínkám.
Google současně vydává Gemini Robotics SDK, které má vývojářům pomoci s hodnocením a přizpůsobením modelu. Významné je, že jde o první VLA model od Googlu, který je dostupný pro doladění, což umožňuje vývojářům přizpůsobit jej konkrétním aplikacím již na základě 50 až 100 ukázek.
Model byl původně trénován pro roboty ALOHA, ale Google jej již adaptoval i pro další platformy, včetně dvouramenného robota Franka FR3 a humanoidního robota Apollo od společnosti Apptronik. Tato univerzálnost naznačuje široké možnosti využití napříč odvětvími od výroby až po zdravotnictví.
Vývoj přichází v době, kdy se konkurence v oblasti robotiky poháněné AI zostřuje – na základních modelech pro roboty pracují také společnosti Nvidia, Hugging Face či RLWRLD. Přístup Googlu, zaměřený na provoz přímo na zařízení, řeší klíčové omezení v oboru tím, že umožňuje robotům efektivně fungovat i tam, kde je cloudové připojení nepraktické nebo nemožné.