Google DeepMind ha dado un paso importante para llevar capacidades avanzadas de inteligencia artificial a robots físicos con el lanzamiento de Gemini Robotics On-Device, un modelo diseñado para ejecutarse completamente en el hardware local del robot.
El nuevo sistema, anunciado a finales de junio de 2025, se basa en la plataforma Gemini Robotics presentada en marzo, que introdujo por primera vez el razonamiento multimodal de Gemini 2.0 en el mundo físico. Lo que hace revolucionario a este último lanzamiento es su capacidad de operar de manera independiente a la conectividad en la nube, manteniendo al mismo tiempo niveles de rendimiento impresionantes.
"Gemini Robotics On-Device muestra una gran destreza de propósito general y generalización de tareas, y está optimizado para ejecutarse de manera eficiente en el propio robot", según el anuncio oficial de Google DeepMind. Esta independencia de la conectividad de red lo hace especialmente valioso para aplicaciones sensibles a la latencia y entornos con conectividad intermitente o nula.
En pruebas de referencia, Google afirma que el modelo en el dispositivo ofrece un rendimiento cercano a su contraparte basada en la nube, superando a otras alternativas en el dispositivo, especialmente en tareas difíciles fuera de distribución y en instrucciones complejas de varios pasos.
El modelo demuestra una adaptabilidad notable, requiriendo solo de 50 a 100 demostraciones para aprender nuevas tareas. Aunque fue entrenado inicialmente para robots ALOHA, Google ha logrado adaptarlo con éxito para trabajar con robots bi-brazo Franka FR3 y el robot humanoide Apollo de Apptronik, mostrando así su versatilidad en diferentes plataformas robóticas.
Junto con el modelo, Google está lanzando un SDK de Gemini Robotics para ayudar a los desarrolladores a evaluar y personalizar la tecnología para sus aplicaciones específicas. El SDK permite realizar pruebas en el simulador físico MuJoCo de Google y proporciona herramientas para una rápida adaptación a nuevos dominios.
Este desarrollo representa un avance significativo en la robótica práctica al llevar inteligencia artificial sofisticada directamente a los dispositivos robóticos. Aunque las aplicaciones para consumidores aún podrían estar a varios años de distancia, Carolina Parada, jefa de robótica en Google DeepMind, ve un potencial amplio: "Podrían ser más útiles en industrias donde los entornos son complejos, la precisión es importante y los espacios no son aptos para humanos. Y también podrían ser útiles en espacios centrados en las personas, como el hogar."