AI系统在情商测试中超越人类

日内瓦大学和伯尔尼大学的研究人员开展了一项开创性研究，发现包括ChatGPT在内的六大主流AI系统在标准情商评估中显著优于人类。AI在应对情绪化场景时的准确率高达82%，而人类仅为56%。此外，ChatGPT-4还能自主生成高质量情商测试，其可靠性与专家设计的测试不相上下。

人工智能在向类人能力演进的道路上又迈出了重要一步。2025年5月22日，日内瓦大学（UNIGE）与伯尔尼大学（UniBE）的研究人员在《Communications Psychology》期刊上发表研究成果，显示AI系统不仅能够理解情绪，甚至在提出恰当情感反应方面可能比人类更胜一筹。

由伯尔尼大学心理学研究所的Katja Schlegel领导的团队，评估了包括ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku和DeepSeek V3在内的六款先进大语言模型（LLM）。这些AI系统接受了五项在学术和企业环境中常用的情商测试。

测试内容为一系列情绪化场景，旨在评估理解、调节和管理情绪的能力。例如，参与者需判断某人在同事窃取其创意并被不公正表扬后，最有效的反应方式。当同样的测试题目用于人类参与者时，结果极为显著：AI系统的平均正确率为82%，远高于人类的56%。

“这表明这些AI不仅理解情绪，还能把握具备情商的行为方式。”日内瓦大学瑞士情感科学中心高级科学家、研究参与者Marcello Mortillaro表示。

更令人瞩目的是，研究的第二阶段中，ChatGPT-4被要求自主设计全新的情商测试及原创场景。这些AI生成的测试随后被用于400多名人类参与者，结果显示其可靠性、清晰度与现实感均与专家耗时多年开发的原版测试相当。

这一发现为AI在教育、辅导、冲突管理等传统上被视为“人类专属”的领域应用带来了新前景。不过，研究人员强调，相关应用仍需专家的适当监督。随着AI展现出愈发复杂的情感能力，人机智能的界限也变得愈发微妙。

Source:

AI系统在情商测试中超越人类

Latest News

DeepSeek升级R1 AI模型，挑战西方科技巨头

Google Beam：革命性3D视频通话将于2025年发布

谷歌在 I/O 2025 发布 Gemini 2.5 Deep Think

AMD收购Enosemi，推动AI硅光子技术发展

沃伦敦促五角大楼确保AI合同竞争，警惕马斯克影响力上升

加州理工学院ATMO机器人实现空中变形，畅行陆空两用

谷歌在I/O 2025发布Project Astra与AI模式

DeepSeek通过知识蒸馏提升阿里巴巴AI性能

字节跳动豆包AI现已支持实时视频辅助功能

一加弃用三段式开关，推出AI驱动的Plus Key按键

AI系统在情商测试中超越人类

Related Articles

DeepSeek升级R1 AI模型，挑战西方科技巨头

AMD收购Enosemi，推动AI硅光子技术发展

沃伦敦促五角大楼确保AI合同竞争，警惕马斯克影响力上升

谷歌在I/O 2025发布Project Astra与AI模式

DeepSeek通过知识蒸馏提升阿里巴巴AI性能

Latest News

DeepSeek升级R1 AI模型，挑战西方科技巨头

Google Beam：革命性3D视频通话将于2025年发布

谷歌在 I/O 2025 发布 Gemini 2.5 Deep Think

AMD收购Enosemi，推动AI硅光子技术发展

沃伦敦促五角大楼确保AI合同竞争，警惕马斯克影响力上升

加州理工学院ATMO机器人实现空中变形，畅行陆空两用

谷歌在I/O 2025发布Project Astra与AI模式

DeepSeek通过知识蒸馏提升阿里巴巴AI性能

字节跳动豆包AI现已支持实时视频辅助功能

一加弃用三段式开关，推出AI驱动的Plus Key按键