Google DeepMind hat mit der Veröffentlichung von Gemini Robotics On-Device einen bedeutenden Schritt gemacht, um fortschrittliche KI-Fähigkeiten in physische Roboter zu bringen. Das Modell ist darauf ausgelegt, vollständig auf lokaler Roboterhardware zu laufen.
Das neue System, das Ende Juni 2025 angekündigt wurde, baut auf der im März eingeführten Gemini Robotics-Plattform auf, die erstmals das multimodale Schlussfolgern von Gemini 2.0 in die physische Welt brachte. Das Besondere an dieser neuesten Version ist ihre Fähigkeit, unabhängig von einer Cloud-Anbindung zu arbeiten und dabei beeindruckende Leistungswerte zu erzielen.
„Gemini Robotics On-Device zeigt eine starke allgemeine Geschicklichkeit und Aufgabenverallgemeinerung und ist darauf optimiert, effizient direkt auf dem Roboter zu laufen“, heißt es in der offiziellen Ankündigung von Google DeepMind. Diese Unabhängigkeit von der Netzwerkverbindung macht das System besonders wertvoll für latenzkritische Anwendungen und Umgebungen mit instabiler oder fehlender Konnektivität.
In Benchmark-Tests behauptet Google, dass das On-Device-Modell ein Leistungsniveau nahe dem seiner Cloud-basierten Variante erreicht und andere On-Device-Alternativen übertrifft – insbesondere bei anspruchsvollen Aufgaben außerhalb des Trainingsbereichs und bei komplexen, mehrstufigen Anweisungen.
Das Modell zeigt eine bemerkenswerte Anpassungsfähigkeit und benötigt nur 50 bis 100 Demonstrationen, um neue Aufgaben zu erlernen. Während es ursprünglich für ALOHA-Roboter trainiert wurde, konnte Google es erfolgreich auf bi-armige Franka FR3-Roboter und den humanoiden Roboter Apollo von Apptronik übertragen, was die Vielseitigkeit auf unterschiedlichen Roboterplattformen unterstreicht.
Zusammen mit dem Modell veröffentlicht Google ein Gemini Robotics SDK, das Entwicklern hilft, die Technologie für ihre spezifischen Anwendungen zu evaluieren und anzupassen. Das SDK ermöglicht Tests im MuJoCo-Physiksimulator von Google und bietet Werkzeuge für eine schnelle Anpassung an neue Einsatzgebiete.
Diese Entwicklung stellt einen bedeutenden Fortschritt für die praktische Robotik dar, da fortschrittliche KI direkt auf Robotersysteme gebracht wird. Auch wenn Anwendungen für Endverbraucher noch Jahre entfernt sein mögen, sieht Carolina Parada, Leiterin der Robotik bei Google DeepMind, großes Potenzial: „Sie könnten in Industrien nützlicher sein, in denen die Setups komplex sind, Präzision wichtig ist und die Umgebungen nicht menschenfreundlich sind. Und sie könnten auch in menschenzentrierten Bereichen wie dem Zuhause hilfreich sein.“