Google сделала важный шаг к интеграции искусственного интеллекта в повседневные рабочие процессы разработчиков, выпустив Gemini CLI — открытого ИИ-агента, который предоставляет мощные возможности языковой модели непосредственно в среде терминала.
Новый инструмент, распространяемый по лицензии Apache 2.0, обеспечивает разработчикам мгновенный доступ к модели Gemini 2.5 Pro от Google через легковесный интерфейс командной строки. Хотя Gemini CLI в первую очередь предназначен для задач программирования, его возможности выходят за рамки генерации кода — он поддерживает создание контента, решение проблем, глубокие исследования и управление задачами, не покидая терминал.
«Для разработчиков интерфейс командной строки — это не просто инструмент, а дом», — заявили в Google в своем анонсе. «Эффективность, вездесущность и портативность терминала делают его основным инструментом для выполнения работы».
Разработчики могут бесплатно пользоваться Gemini CLI с личной учетной записью Google, получая щедрые лимиты: 60 запросов к модели в минуту и 1 000 запросов в сутки. Для большего контроля или высоконагруженных сценариев пользователи могут дополнительно настроить инструмент с помощью API-ключей от Google AI Studio или Vertex AI.
Полностью открытый исходный код Gemini CLI позволяет разработчикам изучать код, оценивать вопросы безопасности и вносить улучшения. Google спроектировала инструмент максимально расширяемым: он поддерживает новые стандарты, такие как Model Context Protocol (MCP), и настраиваемые системные подсказки через файлы GEMINI.md.
Gemini CLI также интегрируется с ИИ-ассистентом для программирования Gemini Code Assist, что позволяет разработчикам бесшовно переключаться между терминальным и IDE-ассистированием на одной и той же модели.
Вместе с анонсом CLI Google поделилась достижениями в области робототехники на базе Gemini 2.5. Модель Gemini Robotics On-Device демонстрирует универсальную ловкость и быструю адаптацию к задачам, оптимизирована для эффективной работы на аппаратуре роботов и функционирует автономно, без необходимости сетевого подключения. Это делает ее подходящей для приложений с низкими задержками и в условиях с нестабильной связью.
Робототехническая модель выполняет инструкции на естественном языке и демонстрирует ловкость в различных задачах, включая расстегивание сумок, складывание одежды и сборку изделий. Это первая модель Google DeepMind класса vision-language-action (VLA), доступная для дообучения, что расширяет возможности Gemini за пределы цифровых сред в сферу физического воплощенного интеллекта.