Using AI for User Representation: An Analysis of 83 Persona Prompts

该研究分析了 27 篇论文中的 83 个用于生成用户画像的大语言模型提示词,发现现有实践倾向于生成单一、简略且包含人口统计信息的文本或结构化数据画像,而缺乏对多模型对比测试及丰富用户画像传统的遵循,并探讨了计算式用户画像增多的影响。

Joni Salminen, Danial Amin, Bernard Jansen

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章就像是一份"AI 造人说明书大调查"。

想象一下,研究人员正在用一种超级聪明的“魔法笔”(也就是现在的 AI 大语言模型,比如 ChatGPT)来画“用户画像”。这些画像不是真人的照片,而是虚构的、代表某一类用户的“角色卡”(在学术界叫"Persona")。以前,画这些卡片需要设计师去采访真人、分析数据,非常耗时;现在,大家想试试能不能直接让 AI 写出来。

这篇论文的作者们就像侦探一样,收集了 27 篇学术论文中使用的83 个“魔法咒语”(也就是给 AI 的指令,Prompt),看看大家到底是怎么用 AI 来造这些“角色卡”的。

以下是这篇论文的核心发现,用大白话和比喻来讲:

1. 大家主要想干什么?(为什么用 AI 造人?)

  • 主要目的:绝大多数时候(80% 以上),大家是用 AI 来生成新的角色卡。就像让 AI 当作家,直接写出一个“典型用户”的故事。
  • 其他用途:也有少数时候,是用这些 AI 生成的角色卡去预测(比如:“如果这个用户看到这条广告,他会怎么反应?”)或者测试(比如:“这个 AI 生成的角色有没有偏见?”)。
  • 应用场景:从设计软件、做营销,到研究气候变化、甚至帮心理咨询师做培训,AI 生成的角色卡无处不在。

2. 大家是怎么念“咒语”的?(怎么用 AI?)

  • 工具单一:大家几乎都在用同一种“魔法笔”(主要是 GPT 系列模型),就像大家都只去同一家便利店买东西,很少尝试别的品牌。
  • 咒语长短不一
    • 有的咒语很短,像“请扮演一个 30 岁的妈妈”。
    • 有的咒语像一本操作手册,分 12 个步骤,先让 AI 生成骨架,再填肉,再画脸,最后生成日程表。
  • 喜欢“填空”:74% 的咒语里,研究人员会把真实的数据(比如“某公司的用户数据”)塞进咒语里,让 AI 基于这些数据来编故事。这就像给 AI 一个填空题,而不是让它凭空瞎编。
  • 只要“结构化”数据:超过一半的研究者要求 AI 把结果整理成表格或代码格式(比如 JSON),就像要求厨师把菜切好装进盒子里,方便后续处理,而不是端上来一盘乱炖。

3. 造出来的“角色卡”长什么样?(生成了什么样的 Persona?)

  • 文字为主,数字为辅:AI 生成的角色,96% 是文字描述,67% 带有数字(比如年龄、收入)。
  • 很少见“全功能”角色:传统的角色卡通常包含:文字故事 + 数字统计 + 真人照片。但在这项研究中,只有 7% 的角色卡包含了图片。大家似乎只让 AI 写故事,忘了让它“画画”。
  • 内容有点“干”
    • 太短了:很多研究者要求 AI“言简意赅”,把描述限制在几句话或几个词。这就像让 AI 写人物传记,却要求它只写微博简介。这违背了传统上“角色卡要丰满、有血有肉”的原则。
    • 太像“人口普查”了:生成的角色里,52% 的信息都是“人口统计学”数据(年龄、性别、职业、居住地)。这就像你问 AI“请描述一个用户”,它回答:“他叫张三,30 岁,男,住北京,开宝马。”至于他喜欢什么、讨厌什么、性格如何,往往被忽略了。
    • 数量太少:很多研究只让 AI 生成一个角色。但现实中用户是多样的,只造一个角色就像只画了一个“标准人”,无法代表千差万别的真实用户。

4. 这有什么好和坏?(研究者的担忧)

  • 好的方面:AI 让造角色变得超级快,而且能结合真实数据,效率很高。
  • 坏的风险
    • 丢了“灵魂”:因为追求简短和结构化,AI 生成的角色可能变得冷冰冰,像 Excel 表格里的数据,而不是一个能让人产生共情的“人”。
    • 刻板印象:如果 AI 只关注年龄、性别等数据,可能会加深刻板印象(比如“程序员都是秃顶的”)。
    • 黑箱操作:有些研究者把 AI 的指令串成了一条长长的链条(A 的输出给 B,B 的输出给 C),一旦中间出错,很难发现是哪里的问题。
    • 缺乏多样性:大家太依赖同一个 AI 模型,可能生成的角色都长得差不多,缺乏真正的多样性。

5. 给未来的建议(怎么做得更好?)

作者最后给了几个“避坑指南”:

  1. 别光靠 AI 瞎编:一定要把真实用户的数据喂给 AI,不要让 AI 只靠它脑子里的“知识”去编故事,否则造出来的就是假人。
  2. 多读点“人学”书:很多搞技术的研究者不懂“角色设计”的理论。建议多看看关于如何建立同理心、如何代表不同群体的理论,别让角色变得太单薄。
  3. 别只盯着一个模型:多试试不同的 AI 工具,看看谁生成的角色更靠谱。
  4. 别只要数据,也要故事:角色卡是为了让人理解用户,所以除了年龄和收入,更需要有温度的故事和细节。

总结一下
这篇论文告诉我们,虽然用 AI 画“用户画像”很酷、很快,但大家现在用得有点太随意了。很多人把 AI 当成了“填表机器”,只想要冷冰冰的数据,而忘了角色卡原本是为了理解活生生的人。未来的方向应该是:用 AI 提高效率,但保留对人性的深刻理解和丰富细节。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →