menu
close

谷歌将AI成本控制功能扩展至Gemini 2.5 Pro

谷歌已将其“思考预算”功能从Gemini 2.5 Flash扩展到Gemini 2.5 Pro,为开发者提供了对AI推理成本的精细化控制。这一功能允许用户限制模型用于推理的Token数量,或完全关闭推理功能,在性能与经济效率之间实现平衡。该功能解决了企业在大规模部署先进AI时面临的关键挑战,因为推理能力通常伴随着显著更高的运营成本。
谷歌将AI成本控制功能扩展至Gemini 2.5 Pro

谷歌宣布,将其创新的“思考预算”功能扩展至公司最先进的AI推理模型Gemini 2.5 Pro,此前该功能已于今年早些时候在Gemini 2.5 Flash中成功上线。

“思考预算”功能在AI成本管理方面实现了重大突破,使开发者能够精确控制分配给复杂问题推理的计算资源。借助这一能力,用户可以指定模型在生成回复前用于内部推理的最大Token数量,甚至可以针对简单任务完全关闭推理功能。

谷歌在公告中表示:“我们在2.5 Flash中推出了思考预算,旨在通过平衡延迟和质量,为开发者提供更多成本控制手段。现在我们将这一能力扩展到2.5 Pro。”公司确认,带有预算功能的Gemini 2.5 Pro将在未来几周内正式面向生产环境开放。

这一进展回应了当前AI市场的核心矛盾:更复杂的推理通常意味着更高的延迟和成本。例如,在Gemini 2.5 Flash中,启用推理功能后,输出成本几乎提升六倍——从每百万Token 0.60美元升至3.50美元。通过实施思考预算,企业可以根据具体应用场景优化AI部署,仅在必要时启用推理功能。

该功能对需要精细管理AI部署成本、同时又需访问高级能力的企业客户尤为有价值。对于如语言翻译、基础信息检索等简单查询,可关闭推理以实现极致成本效率;而对于需要多步推理的复杂任务,如数学问题求解或细致分析,则可启用并精细调整推理功能。

随着AI日益深度融入企业工作流程,谷歌通过可定制推理的做法,反映出市场的成熟——成本优化与性能调优正变得与AI本身的能力同等重要,这也标志着生成式AI商业化进入了新阶段。

Source:

Latest News