Googleは、Project Marinerのコンピュータ操作機能をGemini APIおよびVertex AIプラットフォームに統合することで、AIの能力における大きな進展を発表しました。この統合は、AIがデジタル環境、特にウェブブラウザやコンピュータシステムとどのように対話できるかという点で、重要な進化を示しています。
Project Marinerは、2024年末にGoogle DeepMindの研究プロトタイプとして初めて公開されましたが、現在では強力なAIエージェントシステムへと大幅に強化されています。最新版では、最大10種類のタスクを同時に処理でき、ユーザーのブラウザ上ではなくクラウド上の仮想マシンを通じて動作します。これにより、ユーザーはAIがバックグラウンドでタスクを完了する間も作業を継続できます。
この技術により、AIは画面上に表示されている内容を観察し、複雑な目標を解釈し、実行可能なステップを計画し、ウェブサイトやアプリケーションと対話しながらそれらを実行できます。情報収集、予約、フォーム入力、さらにはユーザーの確認を経て購入手続きまで、幅広いタスクを自動でこなすことが可能です。
すでに複数の企業がこの技術の可能性を探っています。Automation AnywhereやUiPathは業務プロセス自動化に活用しており、Browserbase、Autotab、The Interaction Company、Cartwheelといった新興企業も革新的なアプリケーションの開発を進めています。Googleは今夏より、これらの機能を開発者向けにより広く提供する予定です。
「コンピュータ操作は、エージェントエコシステムの発展に必要な幅広いツール群の一部です」とGoogle CEOのスンダー・ピチャイ氏はGoogle I/O 2025の基調講演で述べました。同社は、エージェント同士の通信を可能にするAgent2Agent Protocolなどの補完技術の開発も進めています。
この技術の影響は多岐にわたります。企業にとっては、繰り返し作業の自動化による生産性向上が期待できます。開発者にとっては、既存ソフトウェアと連携するAI支援型ワークフローやアプリケーションの新たな可能性が開かれます。エンドユーザーにとっても、日常的なデジタル作業の多くをAIが代行することで、作業の効率化や負担軽減が実現するかもしれません。
現在、Project Marinerへのアクセスは米国のGoogle AI Ultra加入者(サービス利用料は月額249.99ドル)に限定されていますが、2025年を通じて技術が成熟し、より多くのGoogle製品に統合されることで、その影響はデジタル分野全体に広がっていくと見込まれます。