谷歌正式向所有用户发布了 Gemini 2.5 Flash,标志着 AI 能力与安全特性的重大进步。
新版 Gemini 2.5 Flash 现已在 Gemini 应用中上线,在多个维度实现了显著提升。谷歌 DeepMind 负责人 Demis Hassabis 表示,Gemini 2.5 Flash 在“几乎所有维度上都更出色”,在推理、多模态、代码和长上下文基准测试中表现更佳。更令人印象深刻的是,该模型在提升性能的同时,效率提高了 22%,生成类似响应所需的 token 更少。
安全性是本次更新的重点之一。谷歌为 Gemini 引入了先进的安全防护措施,大幅提升了其在工具使用过程中抵御间接提示注入攻击的能力。此类攻击通常通过在 AI 检索的数据中嵌入恶意指令实现。谷歌通过模型加固、输入/输出检查以及系统级防护等多重手段,使 Gemini 2.5 成为迄今为止最安全的模型家族。
开发者将于 6 月初在 Google AI Studio 获得新版模型的访问权限,企业用户也可通过 Vertex AI 使用,随后不久 Gemini 2.5 Pro 也将上线。本次发布还带来了面向开发者的新功能,如“思维摘要”,可将模型的推理过程以结构化格式呈现,包含标题和关键信息,便于理解和调试。
Gemini 2.5 Pro 将配备 Deep Think,这是一种专为高难度数学和编码任务设计的实验性推理模式。该功能允许模型在作答前考虑多种假设,因此在 2025 年美国数学奥林匹克(USAMO)测试和 LiveCodeBench 编程竞赛等高难度基准测试中表现优异。
Gemini 2.5 系列还引入了全新的音频能力,包括原生文本转语音,支持 24 种语言的多说话人场景。用户可自定义 AI 的语调、口音和说话风格,模型还能识别用户语音中的情感并做出相应回应。
凭借这些改进,谷歌持续将 Gemini 打造成兼具先进能力与强大安全防护的领先 AI 平台,服务于消费者和企业用户。