Google DeepMind a franchi une étape importante vers l’intégration de capacités d’IA avancées aux robots physiques avec le lancement de Gemini Robotics On-Device, un modèle conçu pour fonctionner entièrement sur le matériel local du robot.
Le nouveau système, annoncé à la fin juin 2025, s’appuie sur la plateforme Gemini Robotics introduite en mars, qui avait permis d’amener le raisonnement multimodal de Gemini 2.0 dans le monde physique. Ce qui distingue cette dernière version, c’est sa capacité à fonctionner de façon autonome, sans connexion au nuage, tout en maintenant des performances impressionnantes.
« Gemini Robotics On-Device démontre une grande dextérité polyvalente et une généralisation des tâches, et il est optimisé pour fonctionner efficacement directement sur le robot », selon l’annonce officielle de Google DeepMind. Cette indépendance vis-à-vis de la connectivité réseau le rend particulièrement précieux pour les applications sensibles à la latence et les environnements où la connexion est intermittente ou inexistante.
Lors de tests de référence, Google affirme que le modèle sur appareil offre des performances proches de celles de sa version infonuagique, tout en surpassant les autres alternatives sur appareil, surtout lors de tâches difficiles hors distribution et d’instructions complexes à étapes multiples.
Le modèle fait preuve d’une adaptabilité remarquable, n’ayant besoin que de 50 à 100 démonstrations pour apprendre de nouvelles tâches. Bien qu’il ait d’abord été entraîné pour les robots ALOHA, Google a réussi à l’adapter pour fonctionner avec des robots bi-bras Franka FR3 et le robot humanoïde Apollo d’Apptronik, démontrant ainsi sa polyvalence sur différentes plateformes robotiques.
En parallèle, Google lance un SDK Gemini Robotics pour aider les développeurs à évaluer et personnaliser la technologie selon leurs besoins spécifiques. Le SDK permet des tests dans le simulateur physique MuJoCo de Google et offre des outils pour une adaptation rapide à de nouveaux domaines.
Cette avancée représente un progrès majeur en robotique pratique, en amenant une IA sophistiquée directement sur les appareils robotiques. Même si les applications grand public pourraient encore prendre quelques années, Carolina Parada, responsable de la robotique chez Google DeepMind, entrevoit un large potentiel : « Ils pourraient être plus utiles dans des industries où les installations sont complexes, où la précision est cruciale et où les espaces ne sont pas adaptés aux humains. Et ils pourraient aussi s’avérer utiles dans des environnements centrés sur l’humain, comme la maison. »