menu
close

Google intègre l’IA aux robots avec le modèle Gemini embarqué

Google DeepMind a lancé Gemini Robotics On-Device, un puissant modèle d’IA qui fonctionne directement sur le matériel robotique sans nécessiter de connexion Internet. S’appuyant sur la sortie de Gemini Robotics en mars, cette nouvelle version embarquée permet aux robots d’exécuter des tâches complexes avec une dextérité remarquable tout en traitant l’IA localement. Cette technologie représente une avancée majeure pour la robotique pratique en combinant les capacités de raisonnement avancées de Gemini 2.5 avec une exploitation efficace sur l’appareil.
Google intègre l’IA aux robots avec le modèle Gemini embarqué

Google DeepMind a franchi une étape majeure dans l’intégration de capacités avancées d’IA aux robots physiques avec la sortie de Gemini Robotics On-Device, un modèle conçu pour fonctionner entièrement sur le matériel local du robot.

Ce nouveau système, annoncé fin juin 2025, s’appuie sur la plateforme Gemini Robotics lancée en mars, qui avait introduit pour la première fois le raisonnement multimodal de Gemini 2.0 dans le monde physique. Ce qui rend cette dernière version révolutionnaire, c’est sa capacité à fonctionner indépendamment de toute connexion au cloud tout en maintenant des performances impressionnantes.

« Gemini Robotics On-Device démontre une grande dextérité polyvalente et une forte généralisation des tâches, et il est optimisé pour fonctionner efficacement directement sur le robot », selon l’annonce officielle de Google DeepMind. Cette indépendance vis-à-vis du réseau le rend particulièrement précieux pour les applications sensibles à la latence et les environnements où la connectivité est intermittente ou inexistante.

Lors des tests de référence, Google affirme que le modèle embarqué affiche des performances proches de celles de son équivalent basé sur le cloud, tout en surpassant les autres alternatives embarquées, notamment sur des tâches complexes hors distribution et des instructions multi-étapes.

Le modèle fait preuve d’une adaptabilité remarquable, n’ayant besoin que de 50 à 100 démonstrations pour apprendre de nouvelles tâches. Bien qu’il ait été initialement entraîné pour les robots ALOHA, Google a réussi à l’adapter pour fonctionner avec des robots bi-bras Franka FR3 ainsi qu’avec le robot humanoïde Apollo d’Apptronik, démontrant ainsi sa polyvalence sur différentes plateformes robotiques.

Parallèlement au modèle, Google propose un SDK Gemini Robotics afin d’aider les développeurs à évaluer et personnaliser la technologie pour leurs applications spécifiques. Le SDK permet des tests dans le simulateur physique MuJoCo de Google et fournit des outils pour une adaptation rapide à de nouveaux domaines.

Ce développement représente une avancée significative pour la robotique pratique en apportant une IA sophistiquée directement sur les dispositifs robotiques. Si les applications grand public pourraient encore mettre des années à voir le jour, Carolina Parada, responsable de la robotique chez Google DeepMind, entrevoit un large potentiel : « Ils pourraient être plus utiles dans les industries où les installations sont complexes, la précision essentielle et les espaces peu adaptés à l’humain. Et ils pourraient aussi être utiles dans des espaces centrés sur l’humain, comme la maison. »

Source:

Latest News