在 AI 系统日益参与各行业关键决策的时代,识别不确定性的能力变得至关重要。2025 年 6 月 3 日,MIT 衍生公司 Themis AI 发布了突破性技术,使 AI 模型能够承认自身知识的不足——这一能力有望在高风险应用场景中彻底提升 AI 的可靠性。
Themis AI 的 Capsa 平台通过精细调整任何机器学习模型的架构,实现对不确定性的量化。“我们的理念是将模型包裹进 Capsa,识别其不确定性和失效模式,然后对模型进行增强。”Themis AI 联合创始人、MIT 教授、MIT 计算机科学与人工智能实验室(CSAIL)主任 Daniela Rus 如此解释。
Themis AI 由 Rus、Alexander Amini(MIT '17, SM '18, PhD '22)和 Elaheh Ahmadi(MIT '20, MEng '21)于 2021 年共同创立,基于五年以上的基础研究。公司致力于解决一个根本性难题:当前的 AI 系统(如大语言模型)往往给出看似合理的答案,却未能揭示知识盲区或不确定性。
这一技术对高风险领域意义重大。在自动驾驶领域,研究显示,集成 Themis AI 不确定性估计算法后,碰撞次数减少了 16 倍,自动请求人工干预的频率下降了 93%。在医疗与制药应用中,Capsa 能帮助识别 AI 预测是基于确凿证据还是仅仅猜测,从而有望加速药物研发并降低风险。
“我们希望让 AI 能够应用于各行业最关键的场景。”Amini 表示,“大家都见过 AI 幻觉或出错的例子。随着 AI 更广泛地部署,这些失误可能带来灾难性后果。Themis 让任何 AI 都能在出错前预测自身的失败。”
该技术已在多个行业落地。许多大语言模型开发公司正借助 Capsa,让模型对每个输出进行不确定性量化,从而实现更可靠的问答,并标记不可靠结果。Themis AI 还与半导体企业合作,提升运行于手机或嵌入式系统的小型 AI 模型,实现低延迟与高质量兼得。