Google зробила значний крок до інтеграції штучного інтелекту у щоденні робочі процеси розробників, випустивши Gemini CLI — відкритий AI-агент, який переносить потужності мовної моделі безпосередньо в середовище терміналу.
Новий інструмент, випущений під ліцензією Apache 2.0, надає розробникам миттєвий доступ до моделі Gemini 2.5 Pro від Google через легкий інтерфейс командного рядка. Хоча основне призначення Gemini CLI — допомога у програмуванні, його можливості виходять за межі генерації коду: він підтримує створення контенту, вирішення задач, глибокі дослідження та керування завданнями — все це без необхідності залишати термінал.
«Для розробників інтерфейс командного рядка — це не просто інструмент, це дім», — зазначили в Google у своєму анонсі. «Ефективність, всюдисущість і портативність терміналу роблять його основним засобом для виконання роботи».
Розробники можуть безкоштовно користуватися Gemini CLI з особистим акаунтом Google, отримуючи щедрі ліміти: 60 запитів до моделі на хвилину та 1 000 запитів на день. Для більшого контролю або високонавантажених сценаріїв користувачі можуть налаштувати інструмент із використанням API-ключів із Google AI Studio або Vertex AI.
Повністю відкритий код Gemini CLI дозволяє розробникам перевіряти програму, оцінювати її безпеку й вносити покращення. Google спроєктувала інструмент максимально розширюваним: він підтримує новітні стандарти, такі як Model Context Protocol (MCP), а також налаштовувані системні підказки через файли GEMINI.md.
Gemini CLI також інтегрується з AI-асистентом для програмування Gemini Code Assist, що дозволяє розробникам безшовно перемикатися між AI-допомогою у терміналі та IDE, використовуючи одну й ту ж модель.
Паралельно з анонсом CLI Google поділилася досягненнями у сфері робототехніки на основі Gemini 2.5. Модель Gemini Robotics On-Device демонструє універсальну спритність і швидку адаптацію до завдань, оптимізована для ефективної роботи на робототехнічному обладнанні. Вона функціонує автономно, без підключення до мережі, що робить її придатною для застосувань із низькою затримкою та у середовищах із нестабільним з'єднанням.
Робототехнічна модель виконує інструкції природною мовою та демонструє спритність у різних завданнях: від розстібання сумок і складання одягу до збирання виробів. Це перша модель Google DeepMind класу vision-language-action (VLA), доступна для донавчання, що ще більше розширює можливості Gemini за межі цифрових середовищ — у сферу фізичного втіленого інтелекту.