谷歌最新的 AI 模型 Gemini 2.5 Flash 现已面向开发者和企业用户全面开放,标志着 AI 编程能力的又一次重大进步。
这款新模型自 4 月份预览以来,在多个维度实现了显著提升。根据 Google DeepMind 的介绍,Gemini 2.5 Flash 在推理能力、多模态处理、代码生成和长上下文处理等方面均有增强,同时在评测中 Token 使用量减少了 20-30%,效率进一步提升。
Gemini 2.5 Flash 的最大亮点在于,它是谷歌首个具备“思考能力”的 Flash 模型。这一特性让模型能够在作答前进行推理,开发者还可以灵活控制“思考预算”,以平衡输出质量、成本和延迟。即使关闭思考功能,模型依然保持了前代产品的高速响应,并在性能上有所提升。
编程能力方面尤为突出。虽然 Gemini 2.5 Pro 以 1415 的 ELO 分数在 WebDev Arena 榜单上领跑,但 2.5 Flash 在代码生成和复杂推理方面也有显著进步,为从 Web 应用开发到数据处理等多种场景的开发者带来价值。
除编程外,Gemini 2.5 Flash 还引入了多项新功能,包括原生音频输出,带来更自然的对话体验,以及支持 24 种语言、多说话人的文本转语音能力。谷歌还将 Project Mariner 的计算机操作能力集成到 Gemini API 和 Vertex AI,使模型能够与计算机界面进行交互。
此次发布是谷歌扩展 Gemini 2.5 家族战略的一部分,目前该系列包括 Flash、Pro 以及新推出的 Flash-Lite 版本。三款模型均支持 100 万 Token 上下文窗口和多模态输入,但针对不同应用场景和效率需求进行了优化。
开发者可通过 Google AI Studio 访问 Gemini 2.5 Flash,企业用户则可通过 Vertex AI 部署。此外,该模型也已集成到 Gemini 应用中,让先进的 AI 能力在谷歌生态系统内更加普及和易用。