谷歌继早前推出 Gemini 2.5 Flash 后,现已正式向开发者和企业开放 Gemini 2.5 Pro,标志着 AI 推理能力的又一次重大飞跃。
Gemini 2.5 Pro 的最大亮点是 Deep Think,这是一种实验性的增强推理模式,使模型在回答问题前能够同时考虑多种假设。谷歌 DeepMind 首席执行官 Demis Hassabis 表示,Deep Think 应用了“最新的思维与推理前沿研究,包括并行思考技术”。该能力在诸如 2025 年美国数学奥林匹克竞赛和 LiveCodeBench(面向竞赛级编程的高难度基准测试)等挑战性测试中表现出色。
本次发布格外重视安全性。谷歌通过全新的安全策略,大幅提升了 Gemini 在工具使用过程中对间接提示注入攻击的防护率。这一策略包括自动化红队测试(ART)和模型加固,即通过在真实场景数据集上微调模型,使其能够识别并忽略恶意嵌入指令。这些改进使 Gemini 2.5 成为谷歌迄今为止最安全的模型家族。
另一项重要升级是 Project Mariner 的计算机操作能力已集成至 Gemini API 和 Vertex AI。Project Mariner 使基于 Gemini 的 AI 智能体能够自主操作网页浏览器,为用户完成各类任务。Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company 和 Cartwheel 等企业已率先探索其潜力,谷歌计划今夏向更多开发者开放。
此次发布还在 Gemini API 和 Vertex AI 中引入了思路摘要功能,通过将模型的原始思考过程以标题、关键信息和模型动作等清晰结构呈现,提升了透明度。
目前,Gemini 2.5 Flash 已在 Google AI Studio(面向开发者)、Vertex AI(面向企业)以及 Gemini 应用(面向普通用户)中开放预览,预计 6 月初全面上线。Gemini 2.5 Pro 将随后推出,Deep Think 功能初期仅对受信测试者开放,谷歌将进行进一步的安全评估。