O Google DeepMind deu um passo significativo para tornar os robôs mais inteligentes e independentes com o lançamento do Gemini Robotics On-Device, um poderoso sistema de IA que opera totalmente no próprio robô, dispensando a nuvem.
Apresentado em 24 de junho de 2025, esse modelo de visão-linguagem-ação (VLA) representa um grande avanço em IA para robótica ao eliminar a necessidade de conectividade constante com a internet. A tecnologia é uma evolução da plataforma Gemini Robotics, lançada em março, que trouxe raciocínio multimodal e compreensão do mundo real às máquinas por meio do framework Gemini 2.0.
Mesmo rodando localmente, o modelo apresenta capacidades impressionantes. Nos testes da Google, ele alcançou desempenho próximo ao do modelo Gemini Robotics baseado na nuvem, superando outras alternativas locais, especialmente em tarefas desafiadoras fora do padrão e em instruções complexas de múltiplas etapas.
"Como o modelo opera de forma independente de uma rede de dados, ele é útil para aplicações sensíveis à latência e garante robustez em ambientes com conectividade intermitente ou inexistente", afirmou o Google DeepMind em seu anúncio.
O Gemini Robotics On-Device demonstra grande destreza geral em diversos cenários de teste. Em demonstrações, robôs equipados com o modelo realizaram tarefas altamente complexas, como abrir zíperes de bolsas e dobrar roupas, sem auxílio da nuvem. O sistema entende comandos em linguagem natural e se adapta a ambientes em mudança em tempo real.
A Google também está lançando um SDK do Gemini Robotics para ajudar desenvolvedores a avaliar e personalizar o modelo. Notavelmente, este é o primeiro modelo VLA da Google disponível para ajuste fino, permitindo que desenvolvedores o adaptem a aplicações específicas com apenas 50 a 100 demonstrações.
Inicialmente treinado para robôs ALOHA, o modelo já foi adaptado para outras plataformas, incluindo o robô bi-braço Franka FR3 e o robô humanóide Apollo, da Apptronik. Essa versatilidade sugere amplo potencial de aplicação em setores que vão da manufatura à saúde.
O desenvolvimento ocorre em meio ao aumento da concorrência em robótica movida por IA, com empresas como Nvidia, Hugging Face e RLWRLD também trabalhando em modelos fundacionais para robôs. A abordagem local da Google resolve uma limitação crítica do setor ao permitir que robôs funcionem de forma eficaz em ambientes onde a conectividade com a nuvem é impraticável ou impossível.