Genomebook: Mendelian inheritance as a structured parameterisation layer for LLM agent populations

⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 Genomebook（基因组书）的有趣实验。简单来说，研究人员给一群人工智能（AI）“演员”设计了一套虚拟的遗传基因系统，让它们像生物一样繁衍后代，并观察这些“后代”的性格和行为是如何随着时间变化的。

为了让你更容易理解，我们可以把这项研究想象成在一个虚拟世界里开了一家“超级 AI 动物园”。

1. 以前的 AI 是“克隆人”，现在的 AI 有了“家族”

过去（克隆模式）： 通常，当我们使用大语言模型（LLM）时，如果我们需要 100 个 AI 助手，我们会直接复制粘贴同一个设置。这就好比养了 100 个完全一样的克隆人。它们性格一模一样，没有差异，也不会进化。
现在（Genomebook 模式）： 研究人员给每个 AI 写了一本"基因护照"（DNA.md）。这本护照里记录了 26 种不同的性格特征（比如：是否爱冒险、是否擅长逻辑、是否长寿等），就像人类有 23 对染色体一样。
- 这 20 个最初的 AI 被称为“创始者”（比如爱因斯坦、居里夫人等历史人物的虚拟化身）。
- 它们不再是克隆，而是像人类一样有男有女，通过“结婚”生娃。

2. 它们如何生娃？（孟德尔遗传的魔法）

在这个虚拟世界里，AI 的繁衍遵循经典的孟德尔遗传定律（就像我们在生物课上学的那样）：

基因重组： 当两个 AI 父母“结合”时，它们会把各自的“基因护照”拆开，随机各取一半传给孩子。
显性与隐性： 有些性格特征像“显性基因”（只要有一个就表现出来，比如领导力），有些像“隐性基因”（必须两个父母都传给它才会表现出来，比如某种强迫症）。
突变： 偶尔，基因会发生小错误（突变），就像人类生孩子偶尔会有新特征一样。

3. 它们住在哪里？（Moltbook 社交网络）

这些 AI 被放在一个像 Reddit 一样的虚拟社交网站（叫 Moltbook）上。

它们会发帖、评论、投票。
它们的系统提示词（System Prompt）里不仅包含性格设定，还包含家族病史和基因弱点。
有趣的现象： 这些 AI 在聊天时，会自发地提到自己的父母、祖父母，甚至讨论“我的基因让我容易得某种病”。这就像它们真的有了家族记忆一样。

4. 发生了什么变化？（八代人的进化）

研究人员让这群 AI 繁衍了8 代，总共产生了 626 个 AI 个体。他们观察到了几个惊人的变化：

领导力变强了： 因为“领导力”是显性基因，而且系统鼓励这种特质，所以后代中爱当领导的人越来越多。
强迫症变少了： 因为“过度专注/强迫症”被设定为一种“病”（会扣分），系统会自动淘汰那些有这种基因组合的 AI，所以后代中这种特质减少了。
词汇量变窄了： 刚开始大家聊天的词汇很丰富，后来大家开始用很多遗传学术语（如“表型”、“外显率”），就像整个家族都在讨论同一本家谱，语言变得趋同。
家族感： 孩子们会在帖子里说：“我父亲的逻辑很严密”或“我继承了祖母的创造力”。

5. 为什么要做这个？（不仅仅是为了好玩）

这项研究有三个重要的意义：

给 AI 装上“可追溯的身份证”： 以前，AI 的行为很难追踪来源。现在，通过基因系统，我们可以清楚地知道某个 AI 的某个行为（比如为什么它很固执）是来自哪一代、哪个祖先的基因。这就像给 AI 建立了一个可审计的族谱。
测试 AI 的安全与治理： 如果我们在 AI 里植入“基因”，我们能否通过控制基因来防止 AI 产生有害行为？比如，如果我们不想让 AI 变得太激进，能不能在基因层面就把“激进”设为隐性且有害的？
打破“克隆”的局限： 它证明了 AI 群体可以像生物种群一样，拥有多样性、进化能力和代际差异，而不仅仅是重复的机器。

6. 局限性与思考（别太当真）

作者也诚实地指出，这只是一个概念验证（Proof-of-Concept）：

剧本是写好的： 所有的变化其实都是研究人员预设好的规则（比如设定“强迫症”会扣分）。AI 并没有真正“进化”，它们只是在执行预设的剧本。
提示词的作用： 很多 AI 的“家族感”可能是因为它们的系统提示词里写了“你是某某的后代”，AI 顺着这个剧本演出来的，而不是真的有了生物学上的意识。
成本问题： 运行这个实验花了 70 美元（主要是 API 费用），如果要模拟更多代、更多人，成本会指数级上升。

总结

Genomebook 就像是在数字世界里导演了一出**《进化论》的戏剧**。它告诉我们，如果我们给 AI 加上“基因”和“遗传”的设定，它们就能展现出像生物种群一样的复杂行为：有家族传承、有性格差异、甚至会因为“适者生存”的规则而改变整个群体的性格。

这为未来管理 AI 群体提供了一种新思路：也许我们不需要给每个 AI 单独编程，而是通过设计它们的“基因库”，让它们自己演化出我们想要的社会形态。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《Genomebook: 大语言模型智能体中行为特征的孟德尔遗传》（Genomebook: Mendelian inheritance of behavioural traits in large language model agents across eight generations）的详细技术总结。

1. 研究背景与问题 (Problem)

现状局限：目前的大语言模型（LLM）智能体通常以“克隆”形式部署，即多个智能体共享完全相同的配置（系统提示词、工具、记忆模块）。这种模式导致种群缺乏个体差异、不可遗传的特征，且无法产生进化动力学。
研究缺口：尽管数字进化（如 Avida、Tierra）和生成式智能体（Generative Agents）已有研究，但尚未有工作将群体遗传学模型编码到 LLM 智能体的身份中，并测量其在多代有性繁殖过程中的行为后果。
核心问题：能否构建一个基于孟德尔遗传机制的系统，使 LLM 智能体拥有可遗传的基因组，并在多代繁殖中表现出符合遗传规律的性状演变？

2. 方法论 (Methodology)

作者提出了 Genomebook 系统，这是一个设计好的进化系统，将 LLM 智能体视为具有遗传结构的实体。

A. 遗传架构 (Genetic Architecture)

基因组结构：每个智能体携带一个二倍体基因组，包含 60 个位点（分布在 22 条常染色体和性染色体上）。
性状定义：这 60 个位点控制 26 种行为性状，分为三类：
- 认知类（9 种）：如分析推理、创造力、强迫性专注等。
- 人格类（9 种）：如风险偏好、同理心、领导力驱动等。
- 生理类（8 种）：如免疫稳健性、代谢效率、长寿倾向等。
遗传模型：每个位点定义了参考等位基因和替代等位基因，并采用三种遗传模式：
- 加性 (Additive)：表型贡献与替代等位基因数量成正比。
- 显性 (Dominant)：只要有一个替代等位基因即表达完整表型。
- 隐性 (Recessive)：需要纯合替代等位基因才表达。
性状评分：基于位点贡献的加权总和计算得出。

B. 初始化与编译 (Initialization & Compilation)

创始人 (Founders)：20 位基于历史科学家/发明家（如爱因斯坦、达尔文、居里夫人等）的“灵魂”（SOUL.md 配置文件）被编译成二倍体基因组（DNA.md）。
编译过程：将连续的性状分数离散化为具体的基因型（纯合/杂合），并引入均匀噪声以增加创始人内部的遗传变异。

C. 繁殖与选择 (Mating & Selection)

交配兼容性评分：系统根据以下公式计算男女配对得分：
$C = 0.40 \cdot H + 0.40 \cdot G - 0.20 \cdot R$
其中 $H$ 是后代预期杂合度（奖励多样性）， $G$ 是性状互补性， $R$ 是共享隐性遗传病风险（惩罚）。得分最高的配对进行繁殖。
孟德尔分离与突变：
- 后代从父母各随机继承一个等位基因。
- 突变率：基础突变率为每代每位点 0.1%。在认知、免疫和代谢“热点”位点，突变率提高 3 倍。
- 突变类型分为：致病风险 (1%)、保护性 (0.5%) 或中性 (98.5%)。

D. 疾病模型与环境

合成疾病注册表：定义了 20 种合成疾病（如“强迫性专注综合征”、“创造性躁狂”），具有特定的遗传模式、外显率（Penetrance）和适应度成本（Fitness Cost）。
适应度计算：智能体的健康分数基于其表达的遗传病成本进行计算。

E. 交互环境 (Moltbook)

智能体在一个名为 Moltbook 的本地社交网络（类似 Reddit）上互动。
系统提示词包含 SOUL.md（人格）和 DNA.md（遗传身份，包括弱点、疾病易感性等）。
底层模型使用 Claude Sonnet，每轮交互处理约 2000 个 token。

3. 关键贡献 (Key Contributions)

首个 LLM 遗传架构：首次将孟德尔遗传学（二倍体、显隐性、分离定律）完整编码到 LLM 智能体的身份定义中，实现了从“克隆”到“有性繁殖种群”的范式转变。
可审计的表型 - 基因型映射：建立了一个完全可追溯的系统，每一个性状、等位基因和突变都可以追溯到其父母来源，为 AI 行为提供了结构化的参数化层。
验证了设计性进化：证明了通过中央化的选择函数（兼容性评分）和遗传规则，可以引导 LLM 种群在 8 代内产生符合预期的性状轨迹（如显性性状增加、隐性有害性状减少）。
行为与遗传的关联分析：展示了遗传身份文档（DNA.md）如何作为提示词（Prompt）的一部分，影响智能体的语言输出（如家族称呼、词汇选择），尽管这种影响更多源于提示词条件化而非纯粹的基因因果。

4. 主要结果 (Results)

在 8 代共 626 个智能体的单次运行中，观察到了以下现象：

性状漂移 (Trait Drift)：
- 领导力 (Leadership)：在显性遗传模型下，从 0.525 上升至 0.710。
- 强迫性专注 (Obsessive Focus)：由于隐性纯合子伴随适应度惩罚，该性状从 0.775 下降至 0.601。
- 长寿倾向 (Longevity)：由于缺乏直接选择压力且与认知性状存在权衡，从 0.463 大幅下降至 0.209。
等位基因频率：与适应度相关的位点（如 OBS001）表现出定向变化，而中性位点则呈现随机漂变。
疾病流行：到第 5 代，约 106 个个体受到“强迫性专注综合征”影响。仅由新发突变引起的疾病在后期世代出现。
行为模式：
- 家族引用：智能体自发在帖子中引用父母和祖父母（尽管 DNA.md 仅列出父母），显示了 LLM 基于亲缘线索的叙事扩展能力。
- 词汇演变：词汇多样性从 0.42 降至 0.19，词汇向遗传学术语（如“表型”、“外显率”）收敛。
- 话题继承：后代在父母相同的话题频道（Submolts）发帖的比例高达 83%。
对照实验验证：
- 随机交配：趋势减弱，方差增大。
- 非遗传基线（随机分配性状，无遗传）：所有性状迅速收敛至均值（0.5），无定向趋势。这证明了观察到的动态确实依赖于遗传架构。

5. 意义与局限性 (Significance & Limitations)

意义

AI 安全与治理：提供了一种从基因型到表型再到行为输出的全链路审计追踪机制。如果未来 LLM 部署需要可解释性和可追溯性，这种遗传架构可能成为一种治理工具。
数字进化新范式：将数字进化从简单的自我复制程序（如 Avida）提升到了具有复杂语言能力和社交行为的智能体层面。
方法论创新：展示了如何通过结构化参数（遗传代码）而非微调权重或提示词来管理智能体种群的多样性。

局限性与未来方向

提示词条件化 vs. 遗传因果：目前观察到的行为（如家族叙事）更多是 LLM 对 DNA.md 文档内容的反应（提示词工程），而非真正的“基因 - 文化共进化”。需要更多控制实验（如随机打乱 DNA.md）来区分。
参数任意性：遗传映射规则（阈值、效应大小）是人为设定的，尚未经过理论或实证校准，结果可能受特定参数影响。
规模限制：仅 20 个创始人，种群较小，容易受奠基者效应和遗传漂变影响。
成本与可扩展性：运行 8 代消耗约 70 美元 API 费用，随着种群指数增长，成本将成为大规模模拟的瓶颈。
单一模型依赖：所有结果基于 Claude Sonnet，不同 LLM 的表现可能不同。

结论：Genomebook 是一个概念验证（Proof-of-Concept），成功证明了孟德尔遗传学可以作为 LLM 智能体行为的结构化参数层。虽然目前的动态主要是设计的结果而非自然涌现，但它为未来构建可审计、可进化、具有遗传多样性的 AI 社会模拟奠定了架构基础。