O Google deu um passo importante para integrar a IA ao cotidiano dos desenvolvedores com o lançamento do Gemini CLI, um agente de IA open source que leva as poderosas capacidades de modelos de linguagem diretamente para o ambiente do terminal.
A nova ferramenta, lançada sob a licença Apache 2.0, oferece aos desenvolvedores acesso imediato ao modelo Gemini 2.5 Pro do Google por meio de uma interface de linha de comando leve. Embora tenha sido projetado principalmente para tarefas de programação, o Gemini CLI vai além da geração de código, oferecendo suporte à criação de conteúdo, resolução de problemas, pesquisas aprofundadas e gerenciamento de tarefas — tudo sem sair do terminal.
"Para os desenvolvedores, a interface de linha de comando não é apenas uma ferramenta; é o lar", afirmou o Google em seu anúncio. "A eficiência, ubiquidade e portabilidade do terminal fazem dele o utilitário preferido para realizar o trabalho."
Os desenvolvedores podem acessar o Gemini CLI gratuitamente com uma conta pessoal do Google, contando com limites generosos de uso: 60 solicitações ao modelo por minuto e 1.000 solicitações por dia. Para maior controle ou casos de uso com maior volume, os usuários também podem configurar a ferramenta com chaves de API do Google AI Studio ou Vertex AI.
Por ser totalmente open source, o Gemini CLI permite que os desenvolvedores inspecionem o código, compreendam suas implicações de segurança e contribuam com melhorias. O Google projetou a ferramenta para ser altamente extensível, suportando padrões emergentes como o Model Context Protocol (MCP) e prompts de sistema personalizáveis via arquivos GEMINI.md.
O Gemini CLI também se integra ao assistente de programação com IA do Google, o Gemini Code Assist, permitindo que os desenvolvedores alternem facilmente entre assistência baseada no terminal e no IDE, utilizando o mesmo modelo de base.
Junto ao anúncio do CLI, o Google compartilhou avanços em aplicações de robótica impulsionadas pelo Gemini 2.5. O modelo Gemini Robotics On-Device da empresa demonstra destreza generalista e rápida adaptação a tarefas, otimizado para rodar de forma eficiente em hardware robótico. Esse modelo opera de forma independente da conectividade de rede, tornando-o adequado para aplicações sensíveis à latência e ambientes com conectividade intermitente.
O modelo de robótica segue instruções em linguagem natural e demonstra destreza para diversas tarefas, incluindo abrir zíperes de bolsas, dobrar roupas e montar produtos. Ele representa o primeiro modelo de visão-linguagem-ação (VLA) da Google DeepMind disponível para fine-tuning, ampliando ainda mais as capacidades do Gemini para além dos ambientes digitais e em direção à inteligência física incorporada.