谷歌通过推出Gemini 2.5 Flash-Lite,进一步增强了其AI产品阵容。Flash-Lite是目前2.5系列中性价比最高、速度最快的模型。
该产品于2025年7月2日发布,Flash-Lite与现已全面开放的Gemini 2.5 Flash和Pro模型共同组成了三层产品体系,以满足不同AI应用场景的需求。Flash-Lite专为高并发、对延迟敏感的任务(如翻译和分类)设计,基准测试显示其延迟低于以往的Flash模型。
尽管Flash-Lite在速度和成本上进行了优化,但它仍保留了Gemini 2.5系列的核心能力,包括100万token上下文窗口、多模态输入支持,以及与Google搜索和代码执行等工具的兼容性。与同系列其他产品不同,Flash-Lite默认关闭“思考”能力以最大化效率,但用户可根据需要开启该功能。
在模型扩展的同时,谷歌还推出了Gemini CLI,这是一款开源AI代理,可将Gemini直接引入开发者终端。该工具基于Apache 2.0协议发布,为编程、内容创作、问题解决和任务管理提供轻量级访问。开发者可通过个人Google账号免费使用Gemini 2.5 Pro,享有每分钟60次、每日1000次的慷慨调用额度。
CLI工具支持通过系统提示和配置进行深度定制,适应多样化的工作流需求。它还可与谷歌AI编程助手Gemini Code Assist集成,为不同开发环境提供统一体验。
这些发布反映了谷歌让先进AI能力更易获取、并针对不同性能和成本需求提供多样化选择的战略。Gemini 2.5系列现已覆盖从面向复杂任务的高性能Pro模型,到适合高吞吐应用的高性价比Flash-Lite模型的完整产品谱系。