斯坦福大学以人为本人工智能研究院(HAI)发布了第八版年度AI指数,为截至2025年5月的全球人工智能格局提供了数据驱动的全景概览。
2025年AI指数通过超过400页的报告,涵盖了研发、技术性能、负责任的AI、经济影响、科学与医学、政策、教育及公众舆论等领域,以丰富的数据和图表厘清了AI领域的诸多迷雾。
去年,美国推出了40个有影响力的AI模型,中国为15个,欧洲仅有3个(均来自法国)。几乎所有2024年发布的模型都来自产业界,而非学术或政府机构。至于2023年至2024年有影响力模型数量的下降,报告认为这可能源于技术日益复杂以及训练成本持续攀升。
产业界正加速引领AI发展,2024年近90%的有影响力AI模型来自产业界,而2023年这一比例为60%;与此同时,学术界依然是高被引论文的主要来源。 AI指数未能获得训练成本的精确数据,因为许多领先AI公司已不再公开训练细节。不过,研究人员与Epoch AI合作,基于训练时长、硬件类型和数量等信息估算了部分模型的训练费用。其中最昂贵的模型为谷歌Gemini 1.0 Ultra,训练成本高达约1.92亿美元。
尽管美国在模型数量上保持领先,中国模型在质量上迅速追赶:在MMLU和HumanEval等主要基准测试上的表现差距,从2023年的两位数缩小到2024年几乎持平。此外,中国在AI论文和专利数量上依然领先全球。
AI正变得更加高效、经济和易用。在能力不断提升的小模型推动下,2022年11月至2024年10月,达到GPT-3.5水平的系统推理成本下降了280多倍。在硬件层面,成本每年下降30%,能效则每年提升40%。开源权重模型也在缩小与闭源模型的差距,部分基准测试上的性能差距从8%降至仅1.7%。这些趋势共同推动了先进AI的门槛快速降低。
企业对AI技术的采用日益加速。2024年,报告中表示其所在组织已应用AI的受访者比例从2023年的55%跃升至78%。同时,报告称在至少一个业务环节使用生成式AI的受访者比例也从2023年的33%增至去年的71%。 然而,AI相关风险也在上升。根据AI事件数据库,2024年AI相关事件数量达到233起,创下新高,较2023年增长56.4%。报告的事件包括深度伪造私密图片,以及聊天机器人被指与青少年自杀事件有关。