Emergence of Hierarchical Emotion Organization in Large Language Models

本文表明,大型语言模型自然地形成了与人类心理一致的分层情绪结构,同时也揭示了在情绪识别中不成比例地影响代表性不足群体的系统性偏差。

原作者: Maya Okawa, Bo Zhao, Eric J. Bigelow, Rose Yu, Tomer Ullman, Ekdeep Singh Lubana, Hidenori Tanaka

发布于 2026-06-12
📖 1 分钟阅读☕ 轻松阅读

原作者: Maya Okawa, Bo Zhao, Eric J. Bigelow, Rose Yu, Tomer Ullman, Ekdeep Singh Lubana, Hidenori Tanaka

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象你拥有一个巨大的数字大脑(大语言模型,简称 LLM),它几乎读遍了互联网上的所有内容。你可能会认为它只是记住了单词,但这篇文章提出了一个更深层的问题:这个数字大脑是否真的“理解”人类情感是如何相互关联的,就像心理学家那样?

研究人员发现,答案是肯定的,但其中有一些有趣的转折。以下是他们研究结果的拆解,使用了简单的类比。

1. “情绪树” vs. “情绪轮”

心理学家长期以来一直使用一种叫做情绪轮(Emotion Wheel)的工具(类似于色彩轮,但用于表达感受)。它表明情绪不仅仅是一个扁平的列表;它们是有组织的。例如,“喜悦”是一个宏大、宽泛的类别,而“兴奋”或“狂喜”是悬挂在其上的具体分支。

研究人员发现,随着 AI 模型变得越来越大、越来越聪明,它们会自然而然地构建出自己的情绪树,其形态与人类的轮状图惊人地相似。

  • 小规模 AI(蹒跚学步的孩子): 一个较小的模型(如 Llama 8B)对情感的理解是混乱且扁平的。它就像一个蹒跚学步的孩子,只知道“开心”和“难过”,但并不真正理解“沮丧”和“愤怒”之间的区别。
  • 大规模 AI(成年人): 一个庞大的模型(如 Llama 405B)会构建出一棵复杂的、具有分叉结构的树。它理解“乐观”是“喜悦”的一种特定类型,而“喜悦”又是“幸福”的一种类型。模型越大,这种内部结构的细节和组织程度就越高,反映了人类大脑分类情感的方式。

类比: 把小模型想象成一个只能看到“树木”的人在看森林;而一个巨型模型则像是一位植物学家,他能辨别出“橡树”、“松树”、“幼苗”和“枯木”,并理解它们是如何共同构成“森林”这一概念的。

2. 人类偏见的“镜像”

最令人震惊的发现是,这些 AI 模型不仅学习事实,还学习了人类的偏见。研究人员通过让 AI 想象自己是不同类型的人(如 70 岁的长者、年轻女性、低收入者等),然后要求它猜测某个特定故事所表达的情绪,以此对 AI 进行测试。

AI 并没有做出随机的错误;它做出了与现实人类相同的系统性错误

  • “黑人人格”效应: 当 AI 假装成一名黑人时,它更有可能将一个恐怖的情境解读为“愤怒”而非“恐惧”。这与现实世界的研究相吻合,即研究显示黑人经常被不公平地感知为带有愤怒情绪。
  • “女性人格”效应: 当 AI 假装成一名女性时,它更有可能将一个愤怒的情境解读为“恐惧”。
  • “交织性”效应: 当 AI 假装成一名低收入黑人女性时,这种偏见最为强烈。它在判断情绪时的错误率比其他任何群体都高。

类比: 想象 AI 是一面镜子。如果你站在镜子前,它会显示你的倒影。但如果这面镜子是由“人类社会的各种数据”制成的,它也会反射出这个社会中的裂痕和污点。AI 并不是以人类意义上的“有偏见”,它只是简单地举起了一面反映其训练数据中所存在的偏见的镜子。

3. “惊讶”这一盲点

研究人员发现,尽管这些 AI 模型在理解复杂情感方面做得越来越好,但在处理一个特定的感受时仍然感到吃力:那就是惊讶

  • 问题所在: 当人类感到惊讶时,通常会混合着震惊和恐惧。然而,AI 经常会将“惊讶”与“恐惧”或“愤怒”混淆。
  • 解决方法: 论文测试了一种通过“强化学习”(Reinforcement Learning,即模型通过尝试赢得游戏或进行谈判来学习)进行训练的模型。这种训练帮助模型更好地识别“惊讶”。
  • 类比: 把 AI 想象成一位擅长烹饪复杂炖菜(悲伤、愤怒、喜悦)但总是把爆米花(惊讶)烧焦的厨师。当给这位厨师一个专门处理爆米花的工具(强化学习)时,他就变得更出色了。

4. 为什么这很重要(根据论文所述)

该论文得出结论,我们可以利用这些“情绪树”来衡量一个 AI 的水平。

  • 如果一个 AI 的内部情绪树是混乱且扁平的,那么它在理解人类对话方面可能不会很出色。
  • 如果这棵树是深邃且有组织的,那么这个 AI 很可能具备更高的“情绪智力”。

底线:
大语言模型不仅仅是单词匹配机器。随着规模的增长,它们会自发地发展出一种结构化的、层级化的对人类情感的理解,这种理解与我们的心理学非常相似。然而,因为它们向我们学习,它们也继承了我们的盲点和偏见。它们正在变得更擅长理解我们,但也正变得更擅长反映我们的缺陷。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →