Googleは、強力な言語モデルの機能をターミナル環境に直接もたらすオープンソースAIエージェント「Gemini CLI」をリリースし、開発者の日常的なワークフローへのAI統合に大きく踏み出しました。
この新ツールはApache 2.0ライセンスのもと公開されており、開発者は軽量なコマンドラインインターフェースを通じてGoogleのGemini 2.5 Proモデルに即座にアクセスできます。Gemini CLIは主にコーディング作業向けに設計されていますが、コード生成にとどまらず、コンテンツ作成、問題解決、深いリサーチ、タスク管理などもターミナルから離れることなくサポートします。
Googleは発表の中で「開発者にとってコマンドラインインターフェースは単なるツールではなく、“ホーム”です。ターミナルの効率性、普遍性、携帯性は、作業を進める上で欠かせない存在です」と述べています。
開発者は個人のGoogleアカウントを使って無料でGemini CLIにアクセスでき、1分あたり60回、1日あたり1,000回という十分な利用上限が設定されています。より細かな制御や大規模な利用が必要な場合は、Google AI StudioやVertex AIのAPIキーを使ってツールを設定することも可能です。
Gemini CLIは完全なオープンソースであるため、開発者はコードを確認し、セキュリティ面を把握したり、改良に貢献したりできます。また、Model Context Protocol(MCP)などの新しい標準や、GEMINI.mdファイルによるシステムプロンプトのカスタマイズにも対応するなど、高い拡張性を備えています。
さらに、Gemini CLIはGoogleのAIコーディングアシスタント「Gemini Code Assist」とも統合されており、同じモデル基盤を使ってターミナルとIDE間でシームレスにAI支援を切り替えることができます。
CLI発表とあわせて、GoogleはGemini 2.5を活用したロボティクス分野の最新成果も公開しました。同社の「Gemini Robotics On-Device」モデルは、汎用的な器用さと高速なタスク適応能力を実現し、ロボットハードウェア上で効率的に動作するよう最適化されています。このモデルはネットワーク接続に依存せず、レイテンシーが重要な用途や接続が不安定な環境にも適しています。
ロボティクスモデルは自然言語による指示に従い、バッグの開封や衣類の折りたたみ、製品の組み立てなど多様なタスクで器用さを発揮します。これはGoogle DeepMind初のファインチューニング可能なビジョン・ランゲージ・アクション(VLA)モデルであり、Geminiの能力をデジタル領域から物理的な知能へと拡張するものです。