人工智能在向类人能力演进的道路上又迈出了重要一步。2025年5月22日,日内瓦大学(UNIGE)与伯尔尼大学(UniBE)的研究人员在《Communications Psychology》期刊上发表研究成果,显示AI系统不仅能够理解情绪,甚至在提出恰当情感反应方面可能比人类更胜一筹。
由伯尔尼大学心理学研究所的Katja Schlegel领导的团队,评估了包括ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku和DeepSeek V3在内的六款先进大语言模型(LLM)。这些AI系统接受了五项在学术和企业环境中常用的情商测试。
测试内容为一系列情绪化场景,旨在评估理解、调节和管理情绪的能力。例如,参与者需判断某人在同事窃取其创意并被不公正表扬后,最有效的反应方式。当同样的测试题目用于人类参与者时,结果极为显著:AI系统的平均正确率为82%,远高于人类的56%。
“这表明这些AI不仅理解情绪,还能把握具备情商的行为方式。”日内瓦大学瑞士情感科学中心高级科学家、研究参与者Marcello Mortillaro表示。
更令人瞩目的是,研究的第二阶段中,ChatGPT-4被要求自主设计全新的情商测试及原创场景。这些AI生成的测试随后被用于400多名人类参与者,结果显示其可靠性、清晰度与现实感均与专家耗时多年开发的原版测试相当。
这一发现为AI在教育、辅导、冲突管理等传统上被视为“人类专属”的领域应用带来了新前景。不过,研究人员强调,相关应用仍需专家的适当监督。随着AI展现出愈发复杂的情感能力,人机智能的界限也变得愈发微妙。