Google DeepMind wykonał znaczący krok w kierunku wyposażenia fizycznych robotów w zaawansowane możliwości AI, prezentując Gemini Robotics On-Device – model zaprojektowany do pracy w całości na lokalnym sprzęcie robotycznym.
Nowy system, ogłoszony pod koniec czerwca 2025 roku, rozwija platformę Gemini Robotics wprowadzoną w marcu, która po raz pierwszy przeniosła multimodalne rozumowanie Gemini 2.0 do świata fizycznego. Przełomowy charakter tej wersji polega na zdolności do działania niezależnie od połączenia z chmurą, przy jednoczesnym zachowaniu wysokiego poziomu wydajności.
„Gemini Robotics On-Device wykazuje dużą uniwersalność, zręczność i zdolność uogólniania zadań, a także został zoptymalizowany pod kątem efektywnej pracy bezpośrednio na robocie” – czytamy w oficjalnym komunikacie Google DeepMind. Niezależność od sieci czyni ten model szczególnie wartościowym w zastosowaniach wymagających niskich opóźnień oraz w środowiskach z niestabilnym lub zerowym dostępem do internetu.
W testach porównawczych Google twierdzi, że model działający na urządzeniu osiąga wyniki zbliżone do wersji chmurowej, przewyższając przy tym inne rozwiązania lokalne, zwłaszcza w przypadku trudnych, nietypowych zadań oraz złożonych instrukcji wieloetapowych.
Model wykazuje imponującą zdolność adaptacji – do nauczenia się nowych zadań potrzebuje jedynie 50–100 demonstracji. Choć początkowo trenowany był dla robotów ALOHA, Google z powodzeniem dostosował go także do pracy z robotami dwuramiennymi Franka FR3 oraz humanoidalnym robotem Apollo firmy Apptronik, co pokazuje jego wszechstronność na różnych platformach.
Równolegle z modelem Google udostępnia Gemini Robotics SDK, który ma pomóc deweloperom w ocenie i dostosowaniu technologii do własnych zastosowań. SDK umożliwia testowanie w symulatorze fizyki MuJoCo od Google oraz oferuje narzędzia do szybkiej adaptacji w nowych dziedzinach.
To osiągnięcie stanowi istotny postęp w praktycznej robotyce, przenosząc zaawansowaną sztuczną inteligencję bezpośrednio na urządzenia robotyczne. Choć zastosowania konsumenckie mogą być jeszcze oddalone o kilka lat, Carolina Parada, szefowa działu robotyki w Google DeepMind, widzi szeroki potencjał: „Mogą być bardziej użyteczne w branżach, gdzie konfiguracje są złożone, precyzja jest kluczowa, a przestrzenie nieprzyjazne dla ludzi. Mogą też okazać się pomocne w przestrzeniach skoncentrowanych na człowieku, takich jak dom”.