最新研究:AI 情商测试完胜人类,准确率高出 25%
2025-05-29 14:39
元宇宙之心
2025-05-29 14:39
订阅此专栏
收藏此文章

‍‍‍‍     



大语言模型能写诗、解复杂数学题,甚至辅助疾病诊断,但它们真的能理解情绪吗? 


伯尔尼大学与日内瓦大学的最新研究表明,这些强大的人工智能系统或许确实具备这种能力,甚至可能超越大多数人类。  



01.

人类情绪测试

近期发表于《通讯心理学》的研究中,研究人员评估了六种最先进的语言模型:ChatGPT-4、ChatGPT-o1、Claude 3.5 Haiku、Copilot 365、Gemini 1.5 Flash 和 DeepSeek V3。这些 AI 系统经过了五项通常用于心理学和工作场所评估的测试,以测试情商(EI)。

这些测试包含复杂的现实场景。例如:同事窃取 Michael 的创意并获得不当赞誉,此时最明智的应对方式是?  

  • 与同事争执  
  • 向上级反映  
  • 默默怨恨  
  • 窃取对方创意报复 

心理学家的标准答案是“向上级反映”,这是一种健康、建设性的方式来处理工作中的情绪紧张。

AI 们表现出色。在五项测试中,其平均准确率达 81%,远高于人类参与者 56% 的平均水平。 

伯尔尼大学首席心理学家 Katja Schlegel 解释道,“我们选取了科研与企业环境中通用的五项测试,这些测试通过情绪化场景来评估理解、调节及管理情绪的能力。”

日内瓦大学瑞士情感科学中心高级科学家 Marcello Mortillaro 补充道:“这表明这些 AI 不仅能理解情感,更掌握了高情商行为的核心要义。”


02.
为什么情商很重要

高情商意味着懂得管理自身情绪并妥善回应他人情感,这种能力在日常生活中举足轻重。拥有高情商的人通常能建立更融洽的人际关系,取得更优异的工作表现,并保持更健康的精神状态。 

以职场为例,善于调节情绪者往往被视为更专业可靠且平易近人。反之,情绪管理不当可能导致工作冲突、人际疏离甚至诱发抑郁倾向。 
 
正因如此,将情商能力植入人工智能,特别是聊天机器人、数字助理及医疗辅助工具,正成为重点发展方向。这个研究领域被称为情感计算,旨在赋予机器阅读和响应人类情感的能力。


自 20 世纪 90 年代 Rosalind Picard 首次提出“情感机器”概念以来,AI 系统在识别情绪信号方面已取得长足进步。如今的 AI 不仅能精准分析语音语调、面部表情和用词选择,其判断准确度甚至时常超越人类。这类技术已在医疗、教育乃至心理健康应用中落地生根。


03.
从识别情绪到理解情绪

尽管成果显著,当前大多数 AI 工具仍局限于单一功能。它们能判断用户是否悲伤或焦虑,却往往不知如何应对。这正是情商能力的价值所在,不仅要识别情绪,更需对其进行推理并作出智慧回应。  

Schlegel 和她的团队试图验证:当今最先进的 AI 能否突破单纯的情绪侦测,像人类一样真正理解情感?

为此,他们精选了五项测试:两项聚焦情绪因果推理,三项考察自我及他人情绪调节能力。所有问题均基于真实的职场与生活场景设计。结果显示,大语言模型不仅表现优异,更屡屡超越人类基准线。它们的答案不仅准确,更能展现对情境脉络和情感复杂性的深刻理解。  

这一发现并非全然出人意料。早前研究便显示,以 ChatGPT-3.5 为例,其在“情绪意识水平量表”测试中表现优于平均水平,该测试要求受试者推断故事人物在不同情境中的情绪反应。  


04.
AI 从解题到命题

在证实 AI 能解答情商测试后,研究者提出了更大胆的设想:AI 能否自主编制测试题?  

借助 ChatGPT-4,团队生成了一套全新测试体系,包含原创情境设置、选项设计和情绪挑战。随后招募 460 余名人类受试者,将 AI 编制的测试题与传统心理学家开发的版本进行对比验证。
  
结果显示:AI 生成的测试题在清晰度、可信度与平衡性方面与耗时数年打磨的专业版本不相上下。参与者高度评价 AI 题项在表述清晰性、情境真实性和情感层次感方面的表现。新旧版本在难度系数与内部一致性指标上也呈现相当水平。  


关键的是,统计学分析显示两者差异微乎其微,所有对比项目的效应量均未超过轻微级别。就整体效度而言,AI 生成的测试题完全符合标准。“这印证了大语言模型确实具备情绪知识储备与情感推理能力,”Mortillaro 指出。


05.
实验室外的应用前景

这些发现将带来哪些实际影响?  
  
首先,这为开发情感辅导类 AI 工具铺平道路。设想一款应用不仅能提供模板化建议,更能理解你的情绪波动,为你量身定制应对方案,无论是化解职场纠纷还是缓解考试焦虑。  

其次,这推动了高情商虚拟导师、治疗师乃至管理者的研发进程。这类智能体将突破固定脚本限制,像善解人意的教师或咨询师那样,根据情绪信号动态调整互动策略。  

当然,现有技术尚无法替代人类特有的共情能力,但它们正在逼近这个曾被视为人类专属的领域。部分专家认为,这预示着通用人工智能(AGI)的发展潜力,即具备跨情绪、逻辑与社会领域综合认知能力的系统。虽然当前模型尚未达标,但其处理情感任务的能力已初现端倪。    

Schlegel 与 Mortillaro 特别强调,人类监督仍不可或缺。这类系统应辅助而非取代人类决策。若运用得当,高情商 AI 或将在教育、心理健康乃至冲突调解领域发挥变革性作用。 


06.
勇敢的新 AI 时代

随着人工智能能力的持续进化,“应该做什么”正变得与“能够做什么”同等重要。情感智能提供了一个答案,未来工具不仅能理解言语,更能读懂情绪。 
  
最新研究发现,机器智能与人类情感理解之间的界限已逐渐模糊。通过审慎开发和负责任的应用,大语言模型或将成为人类情感探索之旅中值得信赖的伙伴,在这个最具人性特质的领域里,与我们并肩同行。 



原文来源于:

1.https://www.thebrighterside.news/post/ai-models-now-show-higher-emotional-intelligence-than-humans-surprising-psychologists/

中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。






最新行业深度研究报告发放中! 资本实验室全新发布 37 页量化报告《 2023 全球区块链应用市场暨业图谱报告(2023) 》,收录 1000+ 应用案例 ,探索区块链应用趋势 , 入群即可免费领取 






XIN 科技周刊(5.18-5.25)
从语音翻译到 3D 会议
这谷歌正在构建“无感交互”未来

普通人如何月入过万?这五大 AI 副业方向值得关注


OpenAI 最大收购!64 亿美元拿下苹果传奇设计师 Ive 团队,进军硬件领域

科技守护餐桌:AI 会是餐饮业的终极答案吗?



【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

元宇宙之心
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开