menu
close

谷歌发布 Gemini 2.5 Flash,具备先进推理能力

谷歌正式预览发布了 Gemini 2.5 Flash,为其高效、低成本的 AI 模型带来了重大升级。新版本引入了混合推理能力,使开发者能够灵活控制模型的思考过程,同时保持速度与效率。目前,Gemini 2.5 Flash 已在 Google AI Studio、Vertex AI 及 Gemini 应用中开放预览,预计将于 2025 年 6 月初全面上线。
谷歌发布 Gemini 2.5 Flash,具备先进推理能力

谷歌推出了 Gemini 2.5 Flash 预览版,这是其高效 AI 模型的最新迭代,旨在实现性能、速度与成本效益之间的最佳平衡。

在 Gemini 2.0 Flash 的基础上,2.5 Flash 在推理能力上实现了重大升级,同时延续了高效的特性。谷歌表示,这是一项“推理能力的重大升级,同时仍然优先考虑速度和成本”。

Gemini 2.5 Flash 的最大亮点在于其混合推理系统。谷歌称其为“首个完全混合推理模型,允许开发者开启或关闭思考功能,并可设置思考预算,以优化质量、成本和延迟之间的平衡”。这一创新方法为开发者带来了前所未有的复杂任务处理控制力。

在实际应用中,开发者可以设定“思考预算”,以控制模型进行推理的程度。他们可通过 Google AI Studio 和 Vertex AI 的滑块,或 API 参数,将模型在思考时可生成的 token 数量从 0 调整至 24,576 个。当思考预算设为零时,模型的成本和延迟与 Gemini 2.0 Flash 持平。

价格体系也体现了这种灵活性:在不启用推理功能时,输入 token 每百万 0.15 美元,输出 token 每百万 0.60 美元;启用思考功能后,成本提升至每百万 token 3.50 美元。

基准测试结果显示,Gemini 2.5 Flash 表现出色。“在 LMArena 的 Hard Prompts 测试中,表现仅次于 2.5 Pro”,且“以远低于同类领先模型的成本和体积,达到了相当的指标”,继续“保持最佳性价比模型的领先地位”。

谷歌称 2.5 Flash 是其“专为速度和低成本设计的最高效主力模型”,并指出其“在推理、多模态、代码和长上下文等关键基准上均有提升,同时更加高效,在评测中 token 使用量减少了 20-30%”。

目前,新模型已通过多个渠道开放预览,正在“向 Google AI Studio(开发者)、Vertex AI(企业)和 Gemini 应用(所有用户)推送”。根据谷歌 I/O 2025 公布的信息,更新版本将于 6 月初在 Google AI Studio(开发者)和 Vertex AI(企业)全面上线,Gemini 2.5 Pro 也将随后推出。

随着谷歌不断扩展 AI 能力,Gemini 2.5 Flash 标志着在让开发者和用户以更低成本获得先进推理能力方面迈出了重要一步。

Source:

Latest News