menu
close

GoogleのGeminiエージェントモード:AIアシスタントが受動型から能動型へと進化

Googleは、ユーザーが最終的な目標を簡単に説明するだけで、AIが自律的に複雑なタスクを代行して完了できるGemini向けの画期的な新機能「エージェントモード」を発表しました。この実験的な機能は、Project Marinerのコンピュータ利用技術を活用しており、開発者向けにはGemini APIやVertex AIにも統合が進められています。Automation Anywhere、UiPath、Browserbaseなど複数の企業が、業務自動化ワークフローの変革に向けてその可能性を探っています。
GoogleのGeminiエージェントモード:AIアシスタントが受動型から能動型へと進化

Googleは、Gemini向けのエージェントモードの導入により、AIアシスタントの可能性を大きく広げています。これは、従来の受動的なクエリ応答型システムから、能動的にタスクを自律的に完了できるエージェントへの根本的な転換を意味します。

エージェントモードは、Google I/O 2025で発表され、ユーザーが目標を伝えるだけで、Geminiがその達成に必要な手順を知的に調整・実行します。この機能は、ライブウェブブラウジング、詳細なリサーチ、Googleアプリとのスマートな連携など高度な機能を組み合わせており、ユーザーの手間を最小限に抑えながら複雑なマルチステップタスクを管理できます。

「目標を伝えるだけで、Geminiがその達成に向けて必要なステップを知的に調整します」とGoogleは発表時に説明しました。この技術は、Project Marinerを基盤としており、ブラウザ上のテキスト、画像、フォーム、その他のウェブ要素を横断的に理解・推論できるGoogleの実験的AIエージェントです。

Googleはまた、Project Marinerのコンピュータ利用機能をGemini APIやVertex AIにも導入し、開発者がこれらのエージェント機能を活用したアプリケーションを構築できるようにしています。Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company、Cartwheelなどの企業がすでにその可能性を模索しており、今夏にはより広範な開発者向け提供も予定されています。

この技術は、「教えて繰り返す」機能なども備えており、ユーザーが一度タスクを実演するだけで、AIがそれを学習し、今後類似の作業を自動で繰り返せるようになります。実際の応用例としては、エージェントモードがZillowなどのサイトで物件検索を行い、条件に応じてフィルターを調整し、内見のスケジュールまで自動で設定するといったことが可能です。

この進化は、ユーザーとAIアシスタントの関わり方に大きな変革をもたらします。従来のように各ステップごとに具体的な指示を出す必要がなくなり、ユーザーは目標全体をGeminiに委任し、AIが自律的に必要なアクションを判断・実行できるようになります。エージェントモードの実験版は、まもなくGoogle AI Ultraの加入者向けに提供される予定であり、Googleはユーザーのコントロール、透明性、安全性の確保にも重点を置いていると強調しています。

Source:

Latest News