通用人工智能(AGI)竞赛已进入关键时刻,OpenAI 的 o3 模型展现出几个月前还被认为不可能实现的能力。
2019 年因揭露谷歌“审查制度”而广受关注的前谷歌吹哨人扎克·沃尔希斯(Zach Vorhies),如今成为了推动加速 AI 发展的积极倡导者。他在近期采访中坚决否认 AI 进展已趋于平缓,强调 OpenAI 的 o3 模型是 AI 加速突破的明确证据。
o3 系统在标准算力条件下于 ARC-AGI 基准测试中取得了 75.7% 的成绩,在更高算力下更是达到 87.5%。这一表现超越了人类在这些专为测试通用智能能力而设计的抽象推理任务上的平均分(80%)。ARC 挑战赛的创始人弗朗索瓦·肖莱(François Chollet)表示,这代表了“AI 能力的一个令人惊讶且重要的阶跃式提升”。
OpenAI 首席执行官萨姆·奥特曼(Sam Altman)公开表示:“我们现在有信心,已经知道如何按照传统理解来构建 AGI。”他预测,“2025 年,我们可能会看到第一批 AI 代理进入职场,并实质性地改变企业产出。”这一时间表与其他行业领袖的预测一致,包括埃隆·马斯克(Elon Musk)和 Anthropic 的达里奥·阿莫代伊(Dario Amodei),他们都认为 AI 系统有望在 2026 年超越人类智能。
沃尔希斯设想,未来 AI 代理将彻底变革工作流程,分为负责制定高层目标的“架构师”角色和执行具体任务的“执行者”角色。这将极大提升各行业效率,但他也警告,这可能带来大规模的岗位流失。
尽管前景令人振奋,专家们也提醒,o3 仍然在一些简单任务上表现不佳,并且需要极高的计算资源。预计 2025 年推出的 ARC-AGI-2 基准测试将带来更大挑战,可能使 o3 的得分降至 30% 以下,而人类依然能够完成这些任务。正如肖莱所言:“当你发现再也无法设计出那些对普通人类简单、但对 AI 困难的任务时,你就会知道 AGI 已经真正到来了。”