谷歌于 2025 年 5 月 20 日在其年度 I/O 开发者大会上,宣布对 Gemini 2.5 模型家族进行了重大升级,显著扩展了其 AI 能力。
最引人注目的进步是 Deep Think,这是 Gemini 2.5 Pro 的实验性增强推理模式,允许模型在作答前并行考虑多种假设。这一方法取得了令人瞩目的成果,谷歌 DeepMind 首席执行官 Demis Hassabis 称其为“将模型性能推向极限”,并采用了“最前沿的思维与推理研究”。
Deep Think 已在多项挑战性基准测试中展现出卓越表现,在 2025 年 USAMO 数学竞赛中获得高分,在 LiveCodeBench 编程竞赛中领先,并在 MMMU 多模态推理任务中取得 84% 的成绩。鉴于其前沿能力,谷歌目前仅向受信任的测试者开放,并进行额外的安全评估。
谷歌还宣布,Gemini 2.5 Flash 现已在 Gemini 应用中向所有用户开放,在推理、编程和多模态任务上性能提升,同时令 token 使用量减少 20-30%。新版将于 6 月初在 Google AI Studio 向开发者和在 Vertex AI 向企业客户全面开放,2.5 Pro 也将很快跟进。
为提升透明度与可控性,谷歌将在 Gemini API 和 Vertex AI 中引入思维摘要功能,将模型的推理过程以结构化格式呈现。公司还将“思考预算”扩展至 2.5 Pro,允许开发者控制模型作答前的思考深度。
这些更新与谷歌 AI 订阅层级的重组同步进行。原 AI Premium 现更名为 Google AI Pro(每月 19.99 美元),全新 Google AI Ultra 层级(每月 249.99 美元)则提供最高使用额度、实验功能(包括 Deep Think 模式)抢先体验,以及 Veo 3 等高级视频生成工具(支持原生音频)的专属访问权。
对于开发者而言,Gemini 2.5 Pro 依然是谷歌应对复杂任务的最先进模型,目前在 WebDev Arena 和 LMArena 排行榜均居首位。谷歌还将 Gemini 2.5 集成进 Google 搜索,AI 模式已向所有美国用户推送,AI 模式和 AI 概览很快也将由定制版 Gemini 2.5 驱动。