Using AI for User Representation: An Analysis of 83 Persona Prompts

Each language version is independently generated for its own context, not a direct translation.

这篇文章就像是一份"AI 造人说明书大调查"。

想象一下，研究人员正在用一种超级聪明的“魔法笔”（也就是现在的 AI 大语言模型，比如 ChatGPT）来画“用户画像”。这些画像不是真人的照片，而是虚构的、代表某一类用户的“角色卡”（在学术界叫"Persona"）。以前，画这些卡片需要设计师去采访真人、分析数据，非常耗时；现在，大家想试试能不能直接让 AI 写出来。

这篇论文的作者们就像侦探一样，收集了 27 篇学术论文中使用的83 个“魔法咒语”（也就是给 AI 的指令，Prompt），看看大家到底是怎么用 AI 来造这些“角色卡”的。

以下是这篇论文的核心发现，用大白话和比喻来讲：

1. 大家主要想干什么？（为什么用 AI 造人？）

主要目的：绝大多数时候（80% 以上），大家是用 AI 来生成新的角色卡。就像让 AI 当作家，直接写出一个“典型用户”的故事。
其他用途：也有少数时候，是用这些 AI 生成的角色卡去预测（比如：“如果这个用户看到这条广告，他会怎么反应？”）或者测试（比如：“这个 AI 生成的角色有没有偏见？”）。
应用场景：从设计软件、做营销，到研究气候变化、甚至帮心理咨询师做培训，AI 生成的角色卡无处不在。

2. 大家是怎么念“咒语”的？（怎么用 AI？）

工具单一：大家几乎都在用同一种“魔法笔”（主要是 GPT 系列模型），就像大家都只去同一家便利店买东西，很少尝试别的品牌。
咒语长短不一：
- 有的咒语很短，像“请扮演一个 30 岁的妈妈”。
- 有的咒语像一本操作手册，分 12 个步骤，先让 AI 生成骨架，再填肉，再画脸，最后生成日程表。
喜欢“填空”：74% 的咒语里，研究人员会把真实的数据（比如“某公司的用户数据”）塞进咒语里，让 AI 基于这些数据来编故事。这就像给 AI 一个填空题，而不是让它凭空瞎编。
只要“结构化”数据：超过一半的研究者要求 AI 把结果整理成表格或代码格式（比如 JSON），就像要求厨师把菜切好装进盒子里，方便后续处理，而不是端上来一盘乱炖。

3. 造出来的“角色卡”长什么样？（生成了什么样的 Persona？）

文字为主，数字为辅：AI 生成的角色，96% 是文字描述，67% 带有数字（比如年龄、收入）。
很少见“全功能”角色：传统的角色卡通常包含：文字故事 + 数字统计 + 真人照片。但在这项研究中，只有 7% 的角色卡包含了图片。大家似乎只让 AI 写故事，忘了让它“画画”。
内容有点“干”：
- 太短了：很多研究者要求 AI“言简意赅”，把描述限制在几句话或几个词。这就像让 AI 写人物传记，却要求它只写微博简介。这违背了传统上“角色卡要丰满、有血有肉”的原则。
- 太像“人口普查”了：生成的角色里，52% 的信息都是“人口统计学”数据（年龄、性别、职业、居住地）。这就像你问 AI“请描述一个用户”，它回答：“他叫张三，30 岁，男，住北京，开宝马。”至于他喜欢什么、讨厌什么、性格如何，往往被忽略了。
- 数量太少：很多研究只让 AI 生成一个角色。但现实中用户是多样的，只造一个角色就像只画了一个“标准人”，无法代表千差万别的真实用户。

4. 这有什么好和坏？（研究者的担忧）

好的方面：AI 让造角色变得超级快，而且能结合真实数据，效率很高。
坏的风险：
- 丢了“灵魂”：因为追求简短和结构化，AI 生成的角色可能变得冷冰冰，像 Excel 表格里的数据，而不是一个能让人产生共情的“人”。
- 刻板印象：如果 AI 只关注年龄、性别等数据，可能会加深刻板印象（比如“程序员都是秃顶的”）。
- 黑箱操作：有些研究者把 AI 的指令串成了一条长长的链条（A 的输出给 B，B 的输出给 C），一旦中间出错，很难发现是哪里的问题。
- 缺乏多样性：大家太依赖同一个 AI 模型，可能生成的角色都长得差不多，缺乏真正的多样性。

5. 给未来的建议（怎么做得更好？）

作者最后给了几个“避坑指南”：

别光靠 AI 瞎编：一定要把真实用户的数据喂给 AI，不要让 AI 只靠它脑子里的“知识”去编故事，否则造出来的就是假人。
多读点“人学”书：很多搞技术的研究者不懂“角色设计”的理论。建议多看看关于如何建立同理心、如何代表不同群体的理论，别让角色变得太单薄。
别只盯着一个模型：多试试不同的 AI 工具，看看谁生成的角色更靠谱。
别只要数据，也要故事：角色卡是为了让人理解用户，所以除了年龄和收入，更需要有温度的故事和细节。

总结一下：
这篇论文告诉我们，虽然用 AI 画“用户画像”很酷、很快，但大家现在用得有点太随意了。很多人把 AI 当成了“填表机器”，只想要冷冰冰的数据，而忘了角色卡原本是为了理解活生生的人。未来的方向应该是：用 AI 提高效率，但保留对人性的深刻理解和丰富细节。

Using AI for User Representation: An Analysis of 83 Persona Prompts

1. 大家主要想干什么？（为什么用 AI 造人？）

2. 大家是怎么念“咒语”的？（怎么用 AI？）

3. 造出来的“角色卡”长什么样？（生成了什么样的 Persona？）

4. 这有什么好和坏？（研究者的担忧）

5. 给未来的建议（怎么做得更好？）

论文技术总结：利用 AI 进行用户表征——83 个角色提示词（Persona Prompts）分析

1. 研究背景与问题 (Problem)

2. 研究方法 (Methodology)

3. 主要贡献 (Key Contributions)

4. 研究结果 (Results)

RQ1: 研究人员为何使用角色提示词？

RQ2: 研究人员如何使用角色提示词？

RQ3: 生成的角色具有什么特征？

5. 研究意义与讨论 (Significance & Discussion)

理论意义

实践建议

局限性与未来工作

Using AI for User Representation: An Analysis of 83 Persona Prompts

1. 大家主要想干什么？（为什么用 AI 造人？）

2. 大家是怎么念“咒语”的？（怎么用 AI？）

3. 造出来的“角色卡”长什么样？（生成了什么样的 Persona？）

4. 这有什么好和坏？（研究者的担忧）

5. 给未来的建议（怎么做得更好？）

论文技术总结：利用 AI 进行用户表征——83 个角色提示词（Persona Prompts）分析

1. 研究背景与问题 (Problem)

2. 研究方法 (Methodology)

3. 主要贡献 (Key Contributions)

4. 研究结果 (Results)

RQ1: 研究人员为何使用角色提示词？

RQ2: 研究人员如何使用角色提示词？

RQ3: 生成的角色具有什么特征？

5. 研究意义与讨论 (Significance & Discussion)

理论意义

实践建议

局限性与未来工作

类似论文

OpenKedge: Governing Agentic Mutation with Execution-Bound Safety and Evidence Chains

From Business Events to Auditable Decisions: Ontology-Governed Graph Simulation for Enterprise AI

Sustained Impact of Agentic Personalisation in Marketing: A Longitudinal Case Study

RAMP: Hybrid DRL for Online Learning of Numeric Action Models

Parameterized Complexity Of Representing Models Of MSO Formulas