Google ha compiuto un passo importante verso l'integrazione dell'intelligenza artificiale nei flussi di lavoro quotidiani degli sviluppatori con il rilascio di Gemini CLI, un agente AI open-source che porta le potenti capacità dei modelli linguistici direttamente nell'ambiente del terminale.
Il nuovo strumento, distribuito sotto licenza Apache 2.0, offre agli sviluppatori accesso immediato al modello Gemini 2.5 Pro di Google tramite un'interfaccia a riga di comando leggera. Sebbene sia stato progettato principalmente per attività di programmazione, Gemini CLI va oltre la semplice generazione di codice, supportando la creazione di contenuti, la risoluzione di problemi, la ricerca approfondita e la gestione delle attività, il tutto senza mai uscire dal terminale.
"Per gli sviluppatori, l'interfaccia a riga di comando non è solo uno strumento; è casa", ha dichiarato Google nel suo annuncio. "L'efficienza, l'ubiquità e la portabilità del terminale lo rendono l'utilità di riferimento per portare a termine il lavoro."
Gli sviluppatori possono accedere a Gemini CLI gratuitamente con un account Google personale, beneficiando di limiti generosi di utilizzo: 60 richieste al modello al minuto e 1.000 richieste al giorno. Per un controllo maggiore o per casi d'uso ad alto volume, è possibile configurare lo strumento con chiavi API provenienti da Google AI Studio o Vertex AI.
La natura completamente open-source di Gemini CLI consente agli sviluppatori di ispezionare il codice, comprenderne le implicazioni sulla sicurezza e contribuire con miglioramenti. Google ha progettato lo strumento per essere altamente estensibile, supportando standard emergenti come il Model Context Protocol (MCP) e prompt di sistema personalizzabili tramite file GEMINI.md.
Gemini CLI si integra inoltre con l'assistente di programmazione AI di Google, Gemini Code Assist, permettendo agli sviluppatori di passare senza soluzione di continuità tra assistenza AI basata su terminale e quella basata su IDE, utilizzando lo stesso modello di base.
Insieme all'annuncio della CLI, Google ha condiviso i progressi nelle applicazioni robotiche alimentate da Gemini 2.5. Il modello Gemini Robotics On-Device dell'azienda dimostra destrezza generica e rapida adattabilità ai compiti, ottimizzato per funzionare in modo efficiente sull'hardware robotico. Questo modello opera in modo indipendente dalla connettività di rete, risultando adatto ad applicazioni sensibili alla latenza e ad ambienti con connettività intermittente.
Il modello robotico segue istruzioni in linguaggio naturale e mostra destrezza in vari compiti, tra cui aprire zip di borse, piegare vestiti e assemblare prodotti. Rappresenta il primo modello vision-language-action (VLA) di Google DeepMind disponibile per il fine-tuning, ampliando ulteriormente le capacità di Gemini oltre gli ambienti digitali verso l'intelligenza incarnata nel mondo fisico.