谷歌通过一系列重大发布,显著扩展了其AI生态系统,进一步巩固了其在生成式AI领域的领先地位。
Gemini 2.5系列现已扩展,Flash和Pro模型均已正式开放生产环境使用。Gemini 2.5 Flash和Pro现已稳定并全面开放,开发者可以放心用于构建生产级应用。Spline、Rooms、Snap和SmartBear等公司已在生产环境中使用这些版本数周。Gemini 2.5 Pro的增长和需求是谷歌有史以来所有模型中最快的,这促使公司将06-05版本设为稳定版,并保持原有定价。谷歌预计Pro模型将在需要最高智能和最强能力的场景(如编程和智能体任务)中表现出色。
此外,谷歌还预览发布了Gemini 2.5 Flash-Lite,这是目前2.5系列中性价比最高、速度最快的模型。该新模型专为大规模分类、摘要等高吞吐量任务设计,具备更优的评测表现、更低的首Token响应时间以及更高的每秒解码Token数。Flash-Lite是一款推理模型,允许通过API参数动态控制“思考预算”。与系列其他模型不同,Flash-Lite默认关闭推理功能,优化重点在于成本和速度。尽管如此,Flash-Lite仍支持所有原生工具,包括与谷歌搜索结合的事实查证、代码执行、URL上下文和函数调用。
在图像生成领域,谷歌发布了Imagen 4,该模型于上月I/O 2025首次亮相。谷歌称其为“迄今为止最强大的文本生成图像模型”,在文本渲染方面较前代有显著提升。新模型在精细细节(如复杂织物、水珠、动物毛发)表现出色,兼具写实与抽象风格。其他改进还包括支持2K分辨率,以及拼写和排版能力的提升。Imagen 4及其高端版Imagen 4 Ultra现已通过Gemini API向付费预览用户开放,Google AI Studio也提供有限免费测试。Imagen 4定价为每张输出图片0.04美元,Ultra版为每张0.06美元。
此次发布还包括Gemini CLI,这是一款开源AI代理,将Gemini的强大能力直接带入开发者终端,支持编程、问题解决与任务管理。用户可通过个人Google账号免费访问Gemini 2.5 Pro,或使用Google AI Studio或Vertex AI密钥获得更多访问权限。Gemini CLI提供业界最大免费额度,每分钟可请求60次模型、每日最多1000次。其AI能力覆盖代码理解、文件操作、命令执行与动态故障排查,为命令行体验带来根本性升级,使用户能够用自然语言编写代码、调试问题、优化工作流。
这些发布共同强化了谷歌在激烈AI竞争格局中的地位,为开发者和用户提供了更强大、高效且易用的工具,适用于广泛的应用场景。