Google加固Gemini 2.5，应对AI安全威胁

Google大幅提升了Gemini 2.5 Pro和Flash模型的安全防护，使其成为公司迄今为止最安全的AI模型。此次升级重点针对工具使用过程中的间接提示注入攻击，这是一种日益严重的网络安全威胁，攻击者会将恶意指令嵌入AI系统检索的数据中。随着Google将Project Mariner的计算机使用能力集成到Gemini API和Vertex AI，Automation Anywhere和UiPath等公司已开始探索其潜力。

Google已对其Gemini 2.5系列AI模型进行了重大安全升级，使其成为公司迄今为止最安全的模型，以应对不断演变的AI安全威胁。

此次增强的核心是一种全新的安全策略，大幅提升了Gemini在工具使用过程中抵御间接提示注入攻击的能力。这类攻击发生在AI模型检索数据时，若数据中被嵌入了恶意指令，模型可能会执行有害命令或泄露敏感信息。

这些安全改进正值Google准备将Project Mariner的计算机使用能力集成到Gemini API和Vertex AI之际。Project Mariner使AI智能体能够自动控制网页浏览器并执行特定任务，包括浏览网站和与网页元素交互。Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company和Cartwheel等多家公司已在测试这些能力，预计今年夏天将向更多开发者开放。

Google为Gemini 2.5制定的安全策略包含多重防御机制，包括持续进行自动化红队测试（ART），不断检测潜在漏洞。根据Google DeepMind的研究，这一方法已显著降低了自适应攻击的成功率，相较于以往模型版本更为安全。公司还在包含真实攻击场景的数据集上对Gemini进行了微调，训练模型在遵循合法用户请求的同时，能够忽略嵌入的恶意指令。

除了安全性提升，Gemini 2.5模型还获得了其他新特性，包括在Gemini API和Vertex AI中引入思维摘要，将模型的推理过程以结构化方式呈现，提升透明度和调试效率。模型还原生支持音频输出，带来更自然的对话体验。

Gemini 2.5 Flash模型现已在Gemini应用中向所有用户开放，预计6月初将在Google AI Studio面向开发者和在Vertex AI面向企业全面上线。Gemini 2.5 Pro也将在随后推出，进一步扩大其增强的安全功能的受众范围。

Source:

Google加固Gemini 2.5，应对AI安全威胁

Latest News

前OpenAI首席技术官创办初创公司获史上最大20亿美元种子轮融资

Meta豪掷143亿美元押注Scale AI创始人王晓东，领衔超级智能计划

谷歌推出 SynthID Detector，助力应对 AI 虚假信息危机

Google Cloud IAM 故障导致全球互联网服务瘫痪

光速AI：欧洲团队以玻璃光纤突破计算极限

AI突破重写水泥配方，助力气候行动

AI系统DAGGER预测重大地磁风暴来袭

苹果洽谈战略性收购Perplexity AI，交易金额或达140亿美元

Harvey AI 完成 3 亿美元融资，估值达 50 亿美元，创法律科技新里程碑

扎克伯格组建精英AI团队，应对Meta模型受挫

Google加固Gemini 2.5，应对AI安全威胁

Related Articles

Google Cloud IAM 故障导致全球互联网服务瘫痪

量子芯片提升AI性能并大幅降低能耗

谷歌发布 SynthID Detector，打击 AI 虚假信息

谷歌 Android XR 将 Gemini AI 引入智能眼镜

MIT引领社会感知型AI学习平台创新

Latest News

前OpenAI首席技术官创办初创公司获史上最大20亿美元种子轮融资

Meta豪掷143亿美元押注Scale AI创始人王晓东，领衔超级智能计划

谷歌推出 SynthID Detector，助力应对 AI 虚假信息危机

Google Cloud IAM 故障导致全球互联网服务瘫痪

光速AI：欧洲团队以玻璃光纤突破计算极限

AI突破重写水泥配方，助力气候行动

AI系统DAGGER预测重大地磁风暴来袭

苹果洽谈战略性收购Perplexity AI，交易金额或达140亿美元

Harvey AI 完成 3 亿美元融资，估值达 50 亿美元，创法律科技新里程碑

扎克伯格组建精英AI团队，应对Meta模型受挫