menu
close

谷歌发布 Agentic Gemini,革新复杂任务处理方式

在 Google I/O 2025 开发者大会上,谷歌宣布为其 Gemini AI 推出代理模式(Agent Mode),通过 Project Mariner 提供的网页浏览能力,实现自主完成复杂任务。该功能将使 Gemini 能够在 Zillow 等网站上完成找房、筛选房源、预约看房等全流程操作。谷歌还宣布 Gemini API/SDK 与 Anthropic 的模型上下文协议(MCP)兼容,显示出业界在智能体标准上的协作趋势。
谷歌发布 Agentic Gemini,革新复杂任务处理方式

谷歌在 2025 年 5 月 20 日的 Google I/O 开发者大会上,正式发布了 Gemini 平台的代理模式(Agent Mode),标志着其在 AI 智能体领域迈出了重要一步。

代理模式由谷歌的 Project Mariner 技术驱动,使 Gemini 成为能够自主完成复杂多步骤任务的助手,用户几乎无需过多干预。该功能让 Gemini 能够浏览网页,理解视觉与文本内容,并代表用户执行各类操作。

“只需陈述你的目标,Gemini 就能智能地规划并完成所有步骤,”谷歌在发布中表示,“代理模式无缝集成了实时网页浏览、深度研究和与谷歌应用的智能联动等先进功能。”

在主题演讲演示中,谷歌 CEO 桑达尔·皮查伊展示了代理模式如何简化找房流程。AI 可根据用户设定的条件在 Zillow 上搜索房源,自动调整筛选条件,甚至预约看房,无需用户频繁切换网站或手动处理细节。

该技术运行于云端虚拟机上,最多可同时管理十项任务,让用户专注于其他事务的同时,Gemini 在后台高效处理繁琐流程。这一能力预示着未来用户与互联网交互方式的重大变革。

为推动行业标准化,谷歌还宣布 Gemini API/SDK 将兼容由 Anthropic 推出的模型上下文协议(MCP)。MCP 是一项开放标准,使 AI 助手能够通过统一协议连接外部工具、数据源和系统。

“模型上下文协议是一个优秀的协议,正在迅速成为 AI 智能体时代的开放标准,”谷歌 DeepMind CEO Demis Hassabis 表示,并强调公司将与 Anthropic 及其他行业伙伴共同推动该协议的发展。

代理模式将率先向美国的 Google AI Ultra 订阅用户开放,未来计划扩展至更多国家。谷歌还将在今年夏天通过 Gemini API 向开发者开放 Project Mariner 的能力,Automation Anywhere 和 UiPath 等受信测试者已率先基于该技术进行开发。

Source:

Latest News