原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明
想象你拥有一个巨大的数字大脑(大语言模型,简称 LLM),它几乎读遍了互联网上的所有内容。你可能会认为它只是记住了单词,但这篇文章提出了一个更深层的问题:这个数字大脑是否真的“理解”人类情感是如何相互关联的,就像心理学家那样?
研究人员发现,答案是肯定的,但其中有一些有趣的转折。以下是他们研究结果的拆解,使用了简单的类比。
1. “情绪树” vs. “情绪轮”
心理学家长期以来一直使用一种叫做情绪轮(Emotion Wheel)的工具(类似于色彩轮,但用于表达感受)。它表明情绪不仅仅是一个扁平的列表;它们是有组织的。例如,“喜悦”是一个宏大、宽泛的类别,而“兴奋”或“狂喜”是悬挂在其上的具体分支。
研究人员发现,随着 AI 模型变得越来越大、越来越聪明,它们会自然而然地构建出自己的情绪树,其形态与人类的轮状图惊人地相似。
- 小规模 AI(蹒跚学步的孩子): 一个较小的模型(如 Llama 8B)对情感的理解是混乱且扁平的。它就像一个蹒跚学步的孩子,只知道“开心”和“难过”,但并不真正理解“沮丧”和“愤怒”之间的区别。
- 大规模 AI(成年人): 一个庞大的模型(如 Llama 405B)会构建出一棵复杂的、具有分叉结构的树。它理解“乐观”是“喜悦”的一种特定类型,而“喜悦”又是“幸福”的一种类型。模型越大,这种内部结构的细节和组织程度就越高,反映了人类大脑分类情感的方式。
类比: 把小模型想象成一个只能看到“树木”的人在看森林;而一个巨型模型则像是一位植物学家,他能辨别出“橡树”、“松树”、“幼苗”和“枯木”,并理解它们是如何共同构成“森林”这一概念的。
2. 人类偏见的“镜像”
最令人震惊的发现是,这些 AI 模型不仅学习事实,还学习了人类的偏见。研究人员通过让 AI 想象自己是不同类型的人(如 70 岁的长者、年轻女性、低收入者等),然后要求它猜测某个特定故事所表达的情绪,以此对 AI 进行测试。
AI 并没有做出随机的错误;它做出了与现实人类相同的系统性错误。
- “黑人人格”效应: 当 AI 假装成一名黑人时,它更有可能将一个恐怖的情境解读为“愤怒”而非“恐惧”。这与现实世界的研究相吻合,即研究显示黑人经常被不公平地感知为带有愤怒情绪。
- “女性人格”效应: 当 AI 假装成一名女性时,它更有可能将一个愤怒的情境解读为“恐惧”。
- “交织性”效应: 当 AI 假装成一名低收入黑人女性时,这种偏见最为强烈。它在判断情绪时的错误率比其他任何群体都高。
类比: 想象 AI 是一面镜子。如果你站在镜子前,它会显示你的倒影。但如果这面镜子是由“人类社会的各种数据”制成的,它也会反射出这个社会中的裂痕和污点。AI 并不是以人类意义上的“有偏见”,它只是简单地举起了一面反映其训练数据中所存在的偏见的镜子。
3. “惊讶”这一盲点
研究人员发现,尽管这些 AI 模型在理解复杂情感方面做得越来越好,但在处理一个特定的感受时仍然感到吃力:那就是惊讶。
- 问题所在: 当人类感到惊讶时,通常会混合着震惊和恐惧。然而,AI 经常会将“惊讶”与“恐惧”或“愤怒”混淆。
- 解决方法: 论文测试了一种通过“强化学习”(Reinforcement Learning,即模型通过尝试赢得游戏或进行谈判来学习)进行训练的模型。这种训练帮助模型更好地识别“惊讶”。
- 类比: 把 AI 想象成一位擅长烹饪复杂炖菜(悲伤、愤怒、喜悦)但总是把爆米花(惊讶)烧焦的厨师。当给这位厨师一个专门处理爆米花的工具(强化学习)时,他就变得更出色了。
4. 为什么这很重要(根据论文所述)
该论文得出结论,我们可以利用这些“情绪树”来衡量一个 AI 的水平。
- 如果一个 AI 的内部情绪树是混乱且扁平的,那么它在理解人类对话方面可能不会很出色。
- 如果这棵树是深邃且有组织的,那么这个 AI 很可能具备更高的“情绪智力”。
底线:
大语言模型不仅仅是单词匹配机器。随着规模的增长,它们会自发地发展出一种结构化的、层级化的对人类情感的理解,这种理解与我们的心理学非常相似。然而,因为它们向我们学习,它们也继承了我们的盲点和偏见。它们正在变得更擅长理解我们,但也正变得更擅长反映我们的缺陷。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。