Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Googleは、Project Marinerのコンピューター操作機能をGemini APIおよびVertex AIに統合し、開発者がウェブインターフェースを自律的に操作・対話できるアプリケーションを構築できるようにします。Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company、Cartwheelなどの企業がすでにこの機能の活用を模索しており、今夏にはより多くの開発者が利用可能となる予定です。この拡大は、GoogleのAIエージェント技術における大きな進展を示しています。

Googleは、Project MarinerのAIシステムを大幅に拡張し、そのコンピューター操作機能をGemini APIおよびVertex AIプラットフォームを通じて開発者向けに提供すると発表しました。

2024年後半に初めて発表されたProject Marinerは、AIエージェントによってユーザーのデジタルインターフェースとの関わり方を変革するというGoogleの野心的な取り組みです。このシステムは、コンピューター画面上に表示されたテキスト、画像、コード、ウェブフォームなどの情報を理解・推論し、自律的にウェブサイトを操作して複雑なタスクを完了することができます。

最新バージョンのProject Marinerは、OpenAIやAmazonのエージェントと同様に、クラウド上の仮想マシンで動作するよう大幅に強化されています。このクラウドベースのアプローチにより、ユーザーはProject Marinerがバックグラウンドでタスクを処理している間に他の作業に取り組むことができ、同時に最大10件の異なる操作を実行可能です。これは、従来のブラウザ内で動作していた前バージョンと比べて大きな進歩です。

Automation AnywhereやUiPathといった自動化の専門企業をはじめ、Browserbase、Autotab、The Interaction Company、Cartwheelなど、複数の企業がすでにProject Marinerの可能性を模索しています。これらのアーリーアダプターは、従来は多くの人手を要していた複雑なウェブベースのワークフローを自動化するために、この技術を活用しています。

Googleはまた、AIモデルが取得するデータに悪意ある指示が埋め込まれる間接的なプロンプトインジェクションなどの脅威から保護するため、高度なセキュリティ対策も導入しています。Googleによれば、これらのセキュリティ強化により、Gemini利用時の保護率が大幅に向上し、Gemini 2.5は同社で最も安全なモデルファミリーとなっています。

Project Marinerの機能は今夏より幅広い開発者が利用可能となる予定で、開発者がコンピューターインターフェースを操作・対話できるAIアプリケーションの構築方法を大きく変革する可能性があります。また、この技術はGoogle検索のAIモードにも統合され、まずはイベントチケットの購入、レストラン予約、地域のアポイントメントのスケジューリングなどのタスクに対応する予定です。

Source:

Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Latest News

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

OnePlus、アラートスライダーを廃止しAI搭載「プラスキー」を導入

ドイツのテック大手がEU支援のAIギガファクトリー建設で結集

米検察、Builder.aiを調査　15億ドルAIスタートアップ破綻の舞台裏

ノルウェーの1.8兆ドル政府系ファンド、AI活用を全社員に義務化

OpenTools.ai、テクノロジー専門家向けAIニュースハブを発表

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

Google、AIコスト管理機能「シンキングバジェット」をGemini 2.5 Proに拡大

Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Related Articles

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

Google、AIコスト管理機能「シンキングバジェット」をGemini 2.5 Proに拡大

Google、Gemini搭載のリアルタイム翻訳スマートグラスで再参入

AnthropicのClaude 4モデル、AIコーディングベンチマークで新記録を樹立

Latest News

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

OnePlus、アラートスライダーを廃止しAI搭載「プラスキー」を導入

ドイツのテック大手がEU支援のAIギガファクトリー建設で結集

米検察、Builder.aiを調査 15億ドルAIスタートアップ破綻の舞台裏

ノルウェーの1.8兆ドル政府系ファンド、AI活用を全社員に義務化

OpenTools.ai、テクノロジー専門家向けAIニュースハブを発表

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

Google、AIコスト管理機能「シンキングバジェット」をGemini 2.5 Proに拡大

米検察、Builder.aiを調査　15億ドルAIスタートアップ破綻の舞台裏