Googleは、2025年5月20日に開催された開発者会議「Google I/O 2025」にて、Geminiプラットフォーム向けの「エージェントモード」を発表し、AIエージェント領域への大きな一歩を踏み出しました。
エージェントモードは、GoogleのProject Mariner技術によって支えられており、Geminiをユーザーの最小限の監督で複雑なマルチステップタスクを自律的に実行できるアシスタントへと進化させます。この機能により、Geminiはウェブサイトの閲覧、視覚・テキスト情報の解釈、さらにはユーザーの代わりにアクションの実行まで可能となります。
Googleは発表の中で「目標を伝えるだけで、Geminiがその達成に必要なステップを知的に組み立てます」と説明しています。「エージェントモードは、ライブウェブブラウジングや高度なリサーチ、Googleアプリとのスマートな連携などの先進機能をシームレスに統合します。」
基調講演では、Google CEOのSundar Pichai氏がエージェントモードによる物件探しの効率化をデモンストレーション。AIはユーザーの条件に基づいてZillowで物件を検索し、フィルターの調整や内見予約までを一括で実行。ユーザーが複数のサイトを行き来したり、細かな作業を手動で管理する必要がなくなります。
この技術はクラウド上の仮想マシンで動作し、最大10件のタスクを同時に処理可能。ユーザーはGeminiがバックグラウンドで時間のかかる作業を進めている間、他の活動に集中できます。これは今後のインターネットとの関わり方を大きく変える進化といえるでしょう。
さらにGoogleは、GeminiのAPI/SDKがAnthropicによるModel Context Protocol(MCP)と互換性を持つことも発表。MCPは、AIアシスタントが外部ツールやデータソース、システムと統一プロトコルで接続できるオープン標準です。
Google DeepMindのCEO、Demis Hassabis氏は「MCPは優れたプロトコルであり、AIエージェント時代のオープン標準として急速に普及しつつあります」と述べ、Anthropicや他の業界パートナーとともに更なる発展に取り組む姿勢を強調しました。
エージェントモードはまず米国のGoogle AI Ultra加入者向けに提供開始され、今後順次他国にも拡大予定です。また、Project Marinerの機能も今夏よりGemini API経由で開発者に公開され、Automation AnywhereやUiPathといった信頼できるテスターが既に技術活用を進めています。