menu
close

OpenAI 推出 o3-mini:为小型模型带来先进推理能力

OpenAI 发布了 o3-mini,这是一款针对 STEM 推理优化、兼具低算力需求和高性价比的 AI 模型。该模型在科学、数学和编程任务上表现出色,相较前代 o1-mini,在复杂问题上的重大错误率降低了 39%。o3-mini 现已通过 ChatGPT 和 API 提供访问,标志着强大 AI 推理能力进一步普及。
OpenAI 推出 o3-mini:为小型模型带来先进推理能力

OpenAI 近日扩展了其推理模型产品线,推出了 o3-mini——这是 "o" 系列中体积更小但功能强大的新成员,进一步突破了小型 AI 模型的能力边界。

作为 OpenAI 推理系列中最具性价比的模型,o3-mini 在保持低成本和低延迟的同时,在 STEM 领域展现出卓越性能。该模型推动了小型模型能力的极限,尤其在科学、数学和编程等领域表现突出,同时延续了 o1-mini 的低成本和低延迟优势。

与前代 o1-mini 类似,o3-mini 针对 STEM 推理进行了优化。在中等推理强度下,其在数学、编程和科学领域的表现可与 o1-mini 媲美,且响应速度更快。专家评测显示,o3-mini 的答案更准确、更清晰,推理能力也更强于 o1-mini。 外部测试者在超过一半的情况下更偏好 o3-mini 的答案。A/B 测试中,o3-mini 在“现实世界难题”上的重大错误率比 o1-mini 低 39%,且能以约 24% 更快的速度给出更清晰的回答。

o3-mini 的一项关键创新是其灵活的推理能力。开发者可根据具体场景,在低、中、高三档推理强度中自由选择。这一灵活性让 o3-mini 能在面对复杂挑战时“深度思考”,或在对延迟敏感时优先保证响应速度。

o3-mini 也是 OpenAI 首款支持高度呼声开发者功能的小型推理模型,包括函数调用、结构化输出和开发者消息,使其一经发布即具备生产级应用能力。 本次发布还将 Plus 和 Team 用户的速率上限从 o1-mini 的每日 50 条消息提升至 o3-mini 的每日 150 条。此外,o3-mini 现已支持搜索功能,可提供带有相关网页链接的最新答案。从即日起,免费用户也可通过消息编辑器选择“Reason”或重新生成回复来体验 o3-mini,这也是推理模型首次向 ChatGPT 免费用户开放。

o3-mini 的发布正值 OpenAI 筹备更强大的 o3 和 o4-mini 模型之际。CEO Sam Altman 在 X 平台宣布,公司将在未来几周内发布 o3 和 o4-mini 两款新模型,GPT-5 则预计将在数月后推出。 截至 2025 年 4 月,o3-mini 已在 ChatGPT 和 API 中被 o4-mini 完全取代。o4-mini 在大多数基准测试中表现更佳,支持原生多模态输入,并保持工具兼容性,同时速度更快、价格更低于 o3。

Source:

Latest News