Google 近日发布了 Gemini CLI,标志着 AI 深度融入开发者日常工作流迈出了重要一步。这款开源 AI 智能体将强大的语言模型能力直接带入终端环境。
Gemini CLI 基于 Apache 2.0 许可证开源,开发者可通过轻量级命令行界面,直接访问 Google 的 Gemini 2.5 Pro 模型。虽然主要面向代码开发场景,但 Gemini CLI 的能力远不止代码生成,还支持内容创作、问题求解、深度调研及任务管理——全部无需离开终端。
Google 在公告中表示:“对开发者而言,命令行界面不仅是工具,更是‘家’。终端的高效、普及和便携性,使其成为完成工作的首选利器。”
开发者使用个人 Google 账号即可免费访问 Gemini CLI,每分钟可发起 60 次模型请求、每日最多 1000 次。对于需要更高请求量或更细致权限控制的场景,用户还可通过 Google AI Studio 或 Vertex AI 的 API 密钥进行配置。
Gemini CLI 完全开源,开发者可自由审查代码、了解安全性并贡献改进。Google 还将其设计为高度可扩展,支持如 Model Context Protocol(MCP)等新兴标准,并可通过 GEMINI.md 文件自定义系统提示。
Gemini CLI 还与 Google 的 AI 编码助手 Gemini Code Assist 集成,开发者可在终端和 IDE 间无缝切换,均基于同一模型底座获得 AI 助力。
在 CLI 发布的同时,Google 还分享了 Gemini 2.5 在机器人领域的最新应用进展。公司推出的 Gemini Robotics On-Device 模型展现了通用灵巧性和任务快速适应能力,并针对机器人硬件高效运行进行了优化。该模型可脱离网络独立运行,适用于对延迟敏感或网络不稳定的场景。
该机器人模型可理解自然语言指令,展现出多任务操作的灵巧性,包括解拉链、叠衣服、产品组装等。这也是 Google DeepMind 首个可微调的视觉-语言-动作(VLA)模型,标志着 Gemini 能力从数字世界进一步拓展至物理智能体领域。