menu
close

Google发布Imagen 4,并扩展Gemini 2.5产品线

Google正式发布了迄今为止最先进的文本生成图像模型Imagen 4,目前已通过Gemini API和Google AI Studio以付费预览形式上线。此次发布还包括Gemini 2.5 Flash和Pro模型的全面可用,以及全新推出的Gemini 2.5 Flash-Lite——这是2.5系列中成本最低、速度最快的模型。开发者还可通过新发布的开源Gemini CLI,在终端直接访问Gemini。
Google发布Imagen 4,并扩展Gemini 2.5产品线

Google在人工智能能力方面实现了重大扩展,正式发布了其最先进的文本生成图像模型Imagen 4,并通过Gemini API和Google AI Studio以付费预览形式上线。

Imagen 4在生成图像的文本渲染质量上较前代有显著提升。本次发布包含两个版本:标准版Imagen 4,每张输出图片收费0.04美元;以及Imagen 4 Ultra,每张图片0.06美元,具备更强的用户指令遵循精度。两款模型均内置SynthID水印技术,该水印对人眼不可见,但有助于识别AI生成内容。

此次发布是Google扩展Gemini 2.5模型家族的重要举措。公司在预览期取得成功后,现已全面开放Gemini 2.5 Flash和Pro模型,同时推出Gemini 2.5 Flash-Lite预览版。Flash-Lite定位为Google 2.5系列中成本最低、速度最快的模型,专为大规模、高延迟敏感任务(如分类、翻译和智能路由)优化。

尽管主打高效,Gemini 2.5 Flash-Lite依然保留了2.5家族的核心能力,包括100万token上下文窗口,以及对Google搜索集成、代码执行等原生工具的支持。与家族中其他默认启用“思考”能力的模型不同,Flash-Lite允许开发者通过API参数灵活控制“思考预算”,且默认关闭以优化速度和成本。

为进一步提升开发者体验,Google还发布了Gemini CLI,这是一款开源AI代理工具,可将Gemini直接带到开发者终端。通过命令行界面,开发者可访问Gemini 2.5 Pro,用于编程、问题求解和任务管理。Gemini CLI采用Apache 2.0开源协议,开发者可审查代码、验证安全性并参与贡献。

Google此次AI新品发布,彰显了其致力于为开发者提供更强大、更灵活工具的承诺,覆盖从高质量图像生成、到高效文本处理及终端AI助手等多元场景和价位。

Source:

Latest News