menu
close

谷歌发布 Gemini 2.5 Pro,推出 Deep Think 推理模式

谷歌正式向开发者和企业发布了 Gemini 2.5 Pro,首次引入专为复杂数学与编程任务设计的实验性 Deep Think 深度推理模式。新一代模型家族在安全防护方面实现重大升级,显著提升了在工具使用过程中对间接提示注入攻击的防护能力,成为谷歌迄今为止最安全的模型家族。Project Mariner 的计算机操作能力现已集成至 Gemini API 和 Vertex AI,Automation Anywhere、UiPath 等企业已率先探索其潜力。
谷歌发布 Gemini 2.5 Pro,推出 Deep Think 推理模式

谷歌继早前推出 Gemini 2.5 Flash 后,现已正式向开发者和企业开放 Gemini 2.5 Pro,标志着 AI 推理能力的又一次重大飞跃。

Gemini 2.5 Pro 的最大亮点是 Deep Think,这是一种实验性的增强推理模式,使模型在回答问题前能够同时考虑多种假设。谷歌 DeepMind 首席执行官 Demis Hassabis 表示,Deep Think 应用了“最新的思维与推理前沿研究,包括并行思考技术”。该能力在诸如 2025 年美国数学奥林匹克竞赛和 LiveCodeBench(面向竞赛级编程的高难度基准测试)等挑战性测试中表现出色。

本次发布格外重视安全性。谷歌通过全新的安全策略,大幅提升了 Gemini 在工具使用过程中对间接提示注入攻击的防护率。这一策略包括自动化红队测试(ART)和模型加固,即通过在真实场景数据集上微调模型,使其能够识别并忽略恶意嵌入指令。这些改进使 Gemini 2.5 成为谷歌迄今为止最安全的模型家族。

另一项重要升级是 Project Mariner 的计算机操作能力已集成至 Gemini API 和 Vertex AI。Project Mariner 使基于 Gemini 的 AI 智能体能够自主操作网页浏览器,为用户完成各类任务。Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company 和 Cartwheel 等企业已率先探索其潜力,谷歌计划今夏向更多开发者开放。

此次发布还在 Gemini API 和 Vertex AI 中引入了思路摘要功能,通过将模型的原始思考过程以标题、关键信息和模型动作等清晰结构呈现,提升了透明度。

目前,Gemini 2.5 Flash 已在 Google AI Studio(面向开发者)、Vertex AI(面向企业)以及 Gemini 应用(面向普通用户)中开放预览,预计 6 月初全面上线。Gemini 2.5 Pro 将随后推出,Deep Think 功能初期仅对受信测试者开放,谷歌将进行进一步的安全评估。

Source:

Latest News