Google DeepMind har tagit ett stort steg mot att föra avancerade AI-funktioner till fysiska robotar med lanseringen av Gemini Robotics On-Device, en modell utformad för att köras helt och hållet på lokal robot-hårdvara.
Det nya systemet, som presenterades i slutet av juni 2025, bygger vidare på Gemini Robotics-plattformen som introducerades i mars och som först förde Gemini 2.0:s multimodala resonemang ut i den fysiska världen. Det som gör denna senaste version banbrytande är dess förmåga att arbeta oberoende av molnuppkoppling, samtidigt som den bibehåller imponerande prestanda.
"Gemini Robotics On-Device visar stark allmän fingerfärdighet och uppgiftsgeneraliseringsförmåga, och är optimerad för att köras effektivt direkt på roboten", enligt Google DeepMinds officiella tillkännagivande. Denna självständighet från nätverksuppkoppling gör teknologin särskilt värdefull för applikationer där låg latens är avgörande eller där uppkopplingen är intermittent eller obefintlig.
I benchmark-tester uppger Google att modellen på enheten presterar på en nivå nära sin molnbaserade motsvarighet och överträffar andra alternativ på enheten, särskilt vid utmanande uppgifter utanför träningsdata och vid komplexa instruktioner i flera steg.
Modellen visar anmärkningsvärd anpassningsförmåga och behöver endast 50–100 demonstrationer för att lära sig nya uppgifter. Även om den initialt tränades för ALOHA-robotar har Google framgångsrikt anpassat den för att fungera med tvåarmade Franka FR3-robotar och Apptroniks Apollo-humanoida robot, vilket visar på dess mångsidighet över olika robotplattformar.
Parallellt med modellen släpper Google även ett Gemini Robotics SDK för att hjälpa utvecklare att utvärdera och anpassa teknologin till sina specifika tillämpningar. SDK:n möjliggör testning i Googles MuJoCo-fysiksimulator och erbjuder verktyg för snabb anpassning till nya domäner.
Denna utveckling utgör ett betydande framsteg för praktisk robotik genom att föra sofistikerad AI direkt till robotenheter. Även om konsumentapplikationer fortfarande kan ligga flera år fram i tiden ser Carolina Parada, chef för robotik på Google DeepMind, en bred potential: "De kan vara mer användbara i industrier där installationerna är komplexa, precision är viktigt och miljöerna inte är människovänliga. Och de kan vara till hjälp i människocentrerade miljöer, som hemmet."