谷歌在其一年一度的I/O 2025开发者大会上,重磅发布了Gemini AI平台的多项重大更新,重点展示了推理能力和教育应用方面的突破。
本次发布的核心亮点是为Gemini 2.5 Pro引入了Deep Think,这是一种实验性的增强推理模式。该新功能采用了前沿研究技术,使模型在作答前能够权衡多种假设。谷歌表示,2.5 Pro Deep Think在2025年美国数学奥林匹克(USAMO)这一当前最具挑战性的数学基准测试中取得了优异成绩,并在LiveCodeBench这一高难度编程竞赛基准中位居榜首。
谷歌还宣布已将LearnLM直接融入Gemini 2.5,定位其为“全球领先的学习模型”。据谷歌最新报告显示,Gemini 2.5 Pro在所有学习科学原理类别中均超越了竞争对手。 该模型目前在WebDev Arena(编程)和LMArena(衡量人类对模型回答偏好)等主流排行榜上名列前茅。得益于与专为教育优化的LearnLM家族模型的深度整合,2.5 Pro被誉为最受教育者青睐的教学模型,教学效果优异。
谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)强调了Gemini模型的快速进步,并指出“Gemini 2.5 Pro在LMArena排行榜所有类别中均实现领先”。 公司还展示了Gemini 2.5 Flash,这是一款被称为“高效强大的主力模型”,因其速度快、成本低而备受开发者欢迎。新版2.5 Flash在推理、多模态、代码和长上下文等关键基准测试中均有提升,在LMArena排行榜上仅次于2.5 Pro。
Gemini 2.5 Flash现已在Gemini应用中面向所有用户开放,预计6月初将在Google AI Studio(开发者)和Vertex AI(企业)全面上线,Gemini 2.5 Pro也将随后推出。谷歌将这一进步归功于“谷歌各团队持续不懈地改进技术,并以安全、负责任的方式开发和发布产品”。
推动这些进步的是Ironwood——谷歌第七代张量处理单元(TPU)。公司称其为“迄今为止最强大、最具能力且能效最高的TPU”。Ironwood专为大规模推理型AI模型打造,已为谷歌最严苛的AI训练和推理任务提供支持。
通过本次更新,谷歌持续推动AI推理和教育能力的边界,不断刷新性能基准,同时强调负责任的开发与部署。