Googleは、Project Marinerのコンピュータ操作機能をGemini APIおよびVertex AIプラットフォームに統合し、エージェンティックAIシステムの開発における大きな前進を果たしました。
Project Marinerは、2024年後半に初公開されたGoogle DeepMindの研究プロトタイプであり、ウェブブラウザを通じた人間とエージェントのインタラクションを探求しています。このシステムは、ブラウザ上に表示された内容を観察し、複雑な目標を解釈して実行可能なステップを計画し、ウェブサイトを自律的に操作してタスクを完了させることができます。最新バージョンでは、同時に最大10件の異なるタスクを処理することも可能です。
すでに複数のテクノロジー企業がProject Marinerの可能性を模索しています。エージェンティックプロセス自動化のリーダーであるAutomation Anywhereや、オートメーションプラットフォームで知られるUiPathが初期導入企業として名を連ねています。その他にも、AIブラウザ自動化フレームワークを開発するBrowserbase、Autotab、The Interaction Company、2023年設立のテキストからアニメーションを生成するプラットフォームCartwheelなどがパートナーに加わっています。
Gemini APIおよびVertex AIとの統合により、開発者はこれらのエージェント機能を活用したアプリケーションを構築できるようになります。Googleはまた、間接的なプロンプトインジェクションなどの脅威に対するセキュリティ保護も大幅に強化しており、Gemini 2.5はこれまでで最も安全なモデルファミリーとなっています。
米国のGoogle AI UltraサブスクライバーはすでにProject Marinerを利用可能で、今夏にはより多くの開発者への提供が予定されています。また、GoogleはMarinerの一部機能をSearch LabsのAIモードなど他のGoogle製品にも展開予定で、イベントチケットの購入やレストラン予約などのタスクをAIが実行できるようになります。
この進展は、ユーザーのインターネットとの関わり方に根本的な変化をもたらすものであり、従来のウェブサイト直接操作からAIエージェントへのタスク委任へと移行する可能性があります。これらの機能が成熟することで、業界全体の自動化を革新し、AIアシスタントの新たな応用が期待されます。