テクノロジー 2025-05-26

Google、Geminiを通じてAIによるコンピュータ制御を開発者に提供

Googleは、Project Marinerのコンピュータ操作機能をGemini APIおよびVertex AIに統合し、AIがコンピュータシステムと直接対話・制御できるようにしました。この進化により、AIは複雑なウェブベースのタスクを自律的に実行できるようになり、Automation Anywhere、UiPath、Browserbaseといった企業がすでにその可能性を探っています。この技術は今夏より開発者向けに広く提供される予定で、AIによる自動化の大きな前進となります。

Googleは、Project Marinerのコンピュータ操作機能をGemini APIおよびVertex AIプラットフォームに統合することで、AIの能力における大きな進展を発表しました。この統合は、AIがデジタル環境、特にウェブブラウザやコンピュータシステムとどのように対話できるかという点で、重要な進化を示しています。

Project Marinerは、2024年末にGoogle DeepMindの研究プロトタイプとして初めて公開されましたが、現在では強力なAIエージェントシステムへと大幅に強化されています。最新版では、最大10種類のタスクを同時に処理でき、ユーザーのブラウザ上ではなくクラウド上の仮想マシンを通じて動作します。これにより、ユーザーはAIがバックグラウンドでタスクを完了する間も作業を継続できます。

この技術により、AIは画面上に表示されている内容を観察し、複雑な目標を解釈し、実行可能なステップを計画し、ウェブサイトやアプリケーションと対話しながらそれらを実行できます。情報収集、予約、フォーム入力、さらにはユーザーの確認を経て購入手続きまで、幅広いタスクを自動でこなすことが可能です。

すでに複数の企業がこの技術の可能性を探っています。Automation AnywhereやUiPathは業務プロセス自動化に活用しており、Browserbase、Autotab、The Interaction Company、Cartwheelといった新興企業も革新的なアプリケーションの開発を進めています。Googleは今夏より、これらの機能を開発者向けにより広く提供する予定です。

「コンピュータ操作は、エージェントエコシステムの発展に必要な幅広いツール群の一部です」とGoogle CEOのスンダー・ピチャイ氏はGoogle I/O 2025の基調講演で述べました。同社は、エージェント同士の通信を可能にするAgent2Agent Protocolなどの補完技術の開発も進めています。

この技術の影響は多岐にわたります。企業にとっては、繰り返し作業の自動化による生産性向上が期待できます。開発者にとっては、既存ソフトウェアと連携するAI支援型ワークフローやアプリケーションの新たな可能性が開かれます。エンドユーザーにとっても、日常的なデジタル作業の多くをAIが代行することで、作業の効率化や負担軽減が実現するかもしれません。

現在、Project Marinerへのアクセスは米国のGoogle AI Ultra加入者（サービス利用料は月額249.99ドル）に限定されていますが、2025年を通じて技術が成熟し、より多くのGoogle製品に統合されることで、その影響はデジタル分野全体に広がっていくと見込まれます。

Source:

Latest News

AI Technology 2025-05-28

Google、Geminiを通じてAIによるコンピュータ制御を開発者に提供

Latest News

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

OnePlus、アラートスライダーを廃止しAI搭載「プラスキー」を導入

ドイツのテック大手がEU支援のAIギガファクトリー建設で結集

米検察、Builder.aiを調査　15億ドルAIスタートアップ破綻の舞台裏

ノルウェーの1.8兆ドル政府系ファンド、AI活用を全社員に義務化

OpenTools.ai、テクノロジー専門家向けAIニュースハブを発表

Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

Google、Geminiを通じてAIによるコンピュータ制御を開発者に提供

Related Articles

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

AnthropicのClaude 4モデル、AIコーディングベンチマークで新記録を樹立

Google、AIモード検索を全米で拡大 高度な機能を搭載

Latest News

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

OnePlus、アラートスライダーを廃止しAI搭載「プラスキー」を導入

ドイツのテック大手がEU支援のAIギガファクトリー建設で結集

米検察、Builder.aiを調査 15億ドルAIスタートアップ破綻の舞台裏

ノルウェーの1.8兆ドル政府系ファンド、AI活用を全社員に義務化

OpenTools.ai、テクノロジー専門家向けAIニュースハブを発表

Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

Google、AIモード検索を全米で拡大　高度な機能を搭載

米検察、Builder.aiを調査　15億ドルAIスタートアップ破綻の舞台裏