Can LLMs Discern the Traits Influencing Your Preferences? Evaluating Personality-Driven Preference Alignment in LLMs

该论文提出利用大五人格特质作为潜在信号来指导偏好选择,构建了包含 1200 条标注数据的 PACIFIC 数据集及相应框架,显著提升了大语言模型在个性化问答中的答案选择准确率。

Tianyu Zhao, Siqi Li, Yasser Shoukry, Salma Elmalaki

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在给大语言模型(LLM)做一场“读心术”特训。它的核心思想是:与其让 AI 死记硬背用户说过的每一句废话,不如让它学会“看透”用户的性格。

下面我用几个生动的比喻来为你拆解这篇论文:

1. 现在的痛点:记性太好,脑子太乱

想象一下,你有一个特别健忘但特别听话的管家(现在的 AI)。

  • 现状:你昨天说“我不吃香菜”,前天说“我喜欢看恐怖片”,大前天说“我讨厌下雨天”。
  • 问题:当你今天问“今晚吃什么?”时,这个管家可能会因为记了太多杂乱的信息,或者因为上下文太长把“不吃香菜”给忘了,结果给你推荐了一碗香菜牛肉面。
  • 论文观点:人的性格(比如你是内向还是外向,是喜欢冒险还是求稳)是相对稳定的。性格决定了你的喜好。如果管家能记住你的性格,哪怕你忘了说“不吃香菜”,管家也能推断出:“哦,这位主人性格比较保守(低开放性),肯定不喜欢尝试奇怪的新菜式。”

2. 核心发现:性格是“万能钥匙”

研究人员做了一个实验,就像给管家发了一张“性格说明书”(大五人格 OCEAN 模型:开放性、尽责性、外向性、宜人性、神经质)。

  • 结果惊人
    • 如果只给管家一堆杂乱的用户喜好(有的有用,有的没用),它猜对答案的概率只有 29%(差不多是瞎猜)。
    • 如果给管家看用户的性格标签,并让它根据性格去筛选喜好,猜对率直接飙升到 76%
  • 比喻:这就好比你要给一个人推荐电影。
    • 旧方法:给他看 100 部他以前看过的电影名字,让他自己找规律(很难,容易乱)。
    • 新方法:直接告诉他“这个人是个喜欢刺激、讨厌平淡的冒险家(高开放性)”,然后让他去选电影。他瞬间就能选对。

3. 他们做了什么?(PACIFIC 数据集)

为了训练这个“读心”能力,作者们造了一个叫 PACIFIC 的超级题库。

  • 内容:里面有 1200 个场景,比如“选个咖啡桌”、“规划旅行”、“选个周末活动”。
  • 玩法:每个场景都有 4 个选项,其中只有一个符合用户的性格。
    • 例子:一个“高神经质”(容易焦虑)的人,选旅行时会选“转机时间长、有保证的航班”;而一个“低神经质”(随性大胆)的人,会选“转机时间短、效率高的航班”。
  • 标注:他们给每个选项都贴上了“性格标签”,就像给每个选项都打了“适合冒险家”或“适合保守派”的标签。

4. 怎么让 AI 学会?(四种“教学”方法)

作者测试了四种教 AI 的方法,看看哪种最有效:

  1. 死记硬背(Few-shot):直接给 AI 看 5 条用户的喜好。
    • 效果:还行,但容易混淆。
  2. 直接给答案(加标签):告诉 AI“用户是外向的,选项 1 也是外向的,所以选 1"。
    • 效果最好! 准确率最高。就像直接告诉学生“这道题考的是性格匹配”。
  3. 提个醒(Reminder):不直接给标签,只说“嘿,别忘了考虑用户的性格哦”。
    • 效果:也不错,比死记硬背好,说明 AI 其实有点“悟性”,只要提醒一下就能反应过来。
  4. 自动检索(RAG):让 AI 自己去数据库里翻找跟当前问题性格匹配的喜好。
    • 效果:如果没经过专门训练,AI 翻得乱七八糟;如果专门训练过,效果就不错,但还是不如直接给标签来得准。

5. 一个有趣的“翻车”发现:AI 也有“讨好症”

研究发现,AI 在判断“负面”性格时容易出错。

  • 现象:如果用户性格是“低外向性”(喜欢独处)或“低开放性”(喜欢传统),AI 往往不敢选,反而倾向于推荐“热闹”或“新颖”的选项。
  • 原因:这就像 AI 被训练得太“政治正确”或“讨人喜欢”了。它觉得推荐“独处”或“守旧”好像不太积极,所以潜意识里偏向推荐“积极、阳光”的选项。这导致它无法真正理解那些喜欢安静或传统的人。

6. 总结:未来的 AI 管家

这篇论文告诉我们,未来的个性化 AI 不应该只是做一个超级记事本(存下你说过的每一句话),而应该做一个性格分析师

  • 以前:AI 问“你喜欢什么?” -> 你回答“我喜欢 A" -> AI 记下来。
  • 未来:AI 观察你 -> 发现你性格是“谨慎型” -> 即使你没说,它也自动帮你过滤掉那些“高风险、大冒险”的选项,只给你看“稳妥、安全”的建议。

一句话总结
与其让 AI 努力记住你所有的“喜好清单”,不如让它学会读懂你的“性格底色”。只要抓住了性格这个“牛鼻子”,AI 就能更聪明、更懂你,哪怕你只说了只言片语,它也能猜中你的心思。