menu
close

AI系统在情商测试中超越人类

2025年5月22日发表在《传播心理学》上的一项开创性研究显示,包括ChatGPT在内的六大领先AI系统在标准情商评估中显著优于人类。日内瓦大学和伯尔尼大学的研究人员发现,这些AI模型在应对情感复杂场景时的平均准确率为82%,而人类仅为56%。研究结果表明,AI能够有效理解、调节和管理情绪,有望变革此前被认为是人类独有的领域。
AI系统在情商测试中超越人类

根据最新研究,人工智能在情感能力方面实现了重大突破,挑战了人们对AI理解人类情感局限性的传统看法。

该研究由伯尔尼大学的Katja Schlegel博士和日内瓦大学瑞士情感科学中心的Marcello Mortillaro博士共同领导,测试了六款先进的大型语言模型(LLM)——包括ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku和DeepSeek V3——让它们接受了五项通常用于评估人类的标准情商测试。

这些评估涵盖了情感复杂的场景,旨在衡量理解、调节和管理情绪的能力。例如,其中一道题要求参与者判断在同事窃取他人创意并获得不应得赞誉时,最有效的应对方式。人类受试者在这些测试中的平均正确率为56%,而AI系统的准确率高达82%。

“这表明这些AI不仅能够理解情绪,还能把握以情商行事的含义。”参与研究的高级科学家Mortillaro博士解释道。

更令人瞩目的是,在研究的第二阶段,ChatGPT-4成功生成了全新情商测试题目,其可靠性和有效性与原始测试相当——而这类测试题的开发,人类研究者通常需要数年时间。当这些AI生成的测试题被用于400多名人类受试者时,结果显示其统计特性与人类设计的题目无异。

这一发现的意义远超学术范畴。随着AI系统日益融入日常生活,其展现出的情商能力有望变革那些曾被认为只能由人类胜任的领域。专家指出,只要有适当的人类专家监管,这些成果为AI在教育、教练和冲突管理等领域的应用打开了新可能。

随着企业加速采用AI技术,麦肯锡的研究显示92%的公司计划在未来三年增加AI投资,这些情商能力或将成为推动各行业人机协作的关键进步。

Source:

Latest News