menu
close

AI系统在情商测试中超越人类

日内瓦大学和伯尔尼大学的研究人员开展了一项开创性研究,发现包括ChatGPT在内的六大主流AI系统在标准情商评估中显著优于人类。AI在应对情绪化场景时的准确率高达82%,而人类仅为56%。此外,ChatGPT-4还能自主生成高质量情商测试,其可靠性与专家设计的测试不相上下。
AI系统在情商测试中超越人类

人工智能在向类人能力演进的道路上又迈出了重要一步。2025年5月22日,日内瓦大学(UNIGE)与伯尔尼大学(UniBE)的研究人员在《Communications Psychology》期刊上发表研究成果,显示AI系统不仅能够理解情绪,甚至在提出恰当情感反应方面可能比人类更胜一筹。

由伯尔尼大学心理学研究所的Katja Schlegel领导的团队,评估了包括ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku和DeepSeek V3在内的六款先进大语言模型(LLM)。这些AI系统接受了五项在学术和企业环境中常用的情商测试。

测试内容为一系列情绪化场景,旨在评估理解、调节和管理情绪的能力。例如,参与者需判断某人在同事窃取其创意并被不公正表扬后,最有效的反应方式。当同样的测试题目用于人类参与者时,结果极为显著:AI系统的平均正确率为82%,远高于人类的56%。

“这表明这些AI不仅理解情绪,还能把握具备情商的行为方式。”日内瓦大学瑞士情感科学中心高级科学家、研究参与者Marcello Mortillaro表示。

更令人瞩目的是,研究的第二阶段中,ChatGPT-4被要求自主设计全新的情商测试及原创场景。这些AI生成的测试随后被用于400多名人类参与者,结果显示其可靠性、清晰度与现实感均与专家耗时多年开发的原版测试相当。

这一发现为AI在教育、辅导、冲突管理等传统上被视为“人类专属”的领域应用带来了新前景。不过,研究人员强调,相关应用仍需专家的适当监督。随着AI展现出愈发复杂的情感能力,人机智能的界限也变得愈发微妙。

Source:

Latest News