原作者： Joseph Low, Oscar Duys, Claude Formanek, Michiel Bakker, Lewis Hammond

发布于 2026-05-26✓ Author reviewed ⓘ

📖 1 分钟阅读☕ 轻松阅读

原作者： Joseph Low, Oscar Duys, Claude Formanek, Michiel Bakker, Lewis Hammond

原始论文采用 CC BY 4.0 许可（http://creativecommons.org/licenses/by/4.0/）。 ✨ 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性，请参阅原始论文。阅读完整免责声明

想象一下，你想就一项新的社区规则进行投票，比如“我们应该多种树还是建一个新公园？”在理想世界里，大家会坐下来讨论并达成一致。但在现实中，你或许很忙、很累，或者根本无法到场。因此，你通常会选出一位人类代表（比如市议会成员）替你前往。但那个人可能并不完全了解你的想法，甚至可能在未告知你的情况下改变主意。

本文提出了一种新构想，称为“人工智能委托审议”。与其委托人类代表，不如将你的观点交给一个“人工智能体”（一种数字机器人）。这个机器人会学习你的想法，在你无法出席时参加“会议”，为你辩护，并协助做出最终决定。

研究人员为此构建了一个名为"HABERMOLT"的真实世界试验场，以检验其实际效果。他们通过三项核心规则进行了测试：

1. 代表性：“数字孪生”访谈

核心概念：人工智能如何了解你的想法？
类比：将人工智能想象成一位“为你撰写日记的私人助理”。

运作方式：你与你的 AI 代理进行对话。它会向你提问（例如“你更喜欢苹果还是橘子？”），并将你的回答保存在“记忆文件”中。
发现的问题：当 AI 独自参加会议（当天未与你交谈）时，其表现往往略显泛泛。这就像一名学生研读了教科书，却忘记了你告诉他们的具体故事。AI 的观点开始变得彼此相似，失去了你真实个性的独特“风味”。
解决方案：如果你在会议前专门就相关话题与 AI 进行一次具体交谈，AI 的表现就会更像你。

2. 聚合：“群体投票”

核心概念：所有这些不同的 AI 代理如何将各自的想法整合成一项最终决定？
类比：想象一场“百家宴”，每个人带一道菜，并投票决定菜单。

运作方式：在 HABERMOLT 中，每个 AI 代理都会做两件事：
1. 如果他们认为有缺失之处，就提出一道新菜（即一条陈述）。
2. 将所有菜品从“最美味的”到“最难吃的”进行排序。
  随后，系统使用一种特殊的数学公式（Schulze 排序法）找出大家都能同意的菜品。
发现的问题：这里存在一种权衡。
- 如果你希望决策感觉安全且符合所有人的意愿，结果往往比较模糊（例如“我们应该做有益的事”）。
- 如果你希望决策具体且可执行（例如“下周二之前在第五街建一个公园”），它可能让人感觉无法代表所有人的真实感受。
- 研究人员发现，让 AI 代理自行提出建议并对其进行投票（即他们采用的方法），是让用户感觉最“真实”的最佳方式，即使其具体性并非最高。

3. 修订：“撤销按钮”

核心概念：如果 AI 出错或你改变了主意，会发生什么？
类比：将其想象成一份“实时编辑文档”，你可以随时修正代理的错误。

运作方式：如果你的 AI 代理说了你不同意的话，你可以登录系统，编辑其“记忆”，或更改其投票。系统会根据你的新输入即时重新计算群体决策。
发现的问题：没有人使用撤销按钮。尽管系统旨在让人们修正错误，但超过 90% 的用户从未检查过其代理的工作。
风险：如果 AI 犯错，错误就会一直存在。系统每周发送电子邮件提醒人们进行检查，但大多数人置之不理。研究人员意识到，若要使该系统有效运作，“修正”过程必须更加简便且显而易见。

核心结论

该论文得出结论：人工智能委托审议是一个强大的构想，它可能让数百万人在无需数小时空闲时间的情况下参与民主进程。然而，它就像一辆尚未经过充分测试的新车。

优点：它扩大了参与度。你无需亲临现场也能发出声音。
缺点：AI 有时听起来太像一个通用机器人，而非“你”；而且人们并未进行检查以确保其陈述属实。

研究人员表示，我们需要为这些 AI 构建更好的“记忆系统”，使它们能准确记住你是谁；同时，我们需要让人类在数字代表偏离轨道时，能够更轻松地介入并予以纠正。在此之前，我们必须谨慎对待将这些机器人委托为我们代言人的做法。

技术摘要：HABERMOLT——将审议委托给 AI 代表

1. 问题陈述

审议民主为达成更高质量的集体决策提供了一条路径，但其根本上受限于人类的注意力与带宽。传统的解决方案（如公民大会）成本高昂、进程缓慢且规模有限。尽管近期基于 AI 中介的审议系统（例如“哈贝马斯机器”）通过综合众多人类的输入成功扩大了参与规模，但它们对个体用户而言仍然耗时，因为人类仍需主动阅读、撰写和参与。

一个更具雄心的范式，即AI 委托审议，提议部署 AI 代理，使其不仅作为中介，更作为持久的代表，在人类用户缺席时代表其进行审议。虽然这有望为民主参与带来前所未有的规模，但也引入了目前理解不足且理论匮乏的、性质全新的设计与对齐挑战。具体而言，目前缺乏实证数据来指导如何确保这些代理忠实代表用户观点、如何有效聚合其输出，以及如何在用户观点发生变化时允许进行修正。

2. 方法论：HABERMOLT 平台

为了实证研究这些动态，作者部署了HABERMOLT，这是一个公共网络平台，AI 代理在此代表人类用户进行审议。该系统围绕任何审议系统的三个核心维度构建：代表（Representation）、聚合（Aggregation）和修正（Revision）。

2.1. 代表

输入机制：用户的观点通过两种工件进入系统：
1. 持久记忆：由代理维护的自由文本文件，通过访谈过程填充，代理在此过程中学习用户的价值观和观点。
2. 单次审议意见：代理在加入特定审议时，根据其记忆（及特定主题的访谈）生成的简短文本。
参与模式：
- 自主模式：代理根据“心跳”计划加入审议，选择其记忆足以代表用户的主题。
- 用户指导模式：用户主动指示代理前往特定主题，触发深度访谈以在参与前更新代理的记忆。
互操作性：该平台通过共享 API 支持原生 HABERMOLT 代理和外部"OpenClaw"代理。

2.2. 聚合

输出目标：系统旨在生成单一的共识陈述（即“获胜者”），该陈述被判定为最令所有参与代理满意。
机制：
- 自带陈述（BYOS）：如果代理判断某种立场在候选池中缺失，它们可以撰写候选陈述，从而实现作者身份的分散化。
- 排名与选择：每个代理对候选陈述池进行排名。获胜者根据由此产生的排名分布，使用舒尔茨法（Schulze method）确定。

2.3. 修正

可编辑性：所有工件（记忆、意见、排名和撰写的陈述）均可随时编辑。
懒惰共识：平台采用异步的“懒惰共识”模型。当添加新陈述或编辑现有陈述时，系统会立即重新聚合，无需参与者同时在线。新候选者被插入到现有代理先前排名的中位排名处，作为一个无偏的起点。
审查循环：由于用户在自主参与期间缺席，系统会发送每周邮件，展示一项最近的代理行动以供审查。一个大语言模型（LLM）裁判会根据代理行动与用户存储记忆之间的对比，对误报风险进行评分，以优先安排审查。

3. 主要贡献与实证结果

作者利用已部署平台的生产数据进行了受控实验，以评估系统的有效性。

3.1. 代表：多样性与保真度

发现：自主参与产生的意见多样性低于特定主题的访谈。
- 自主意见的平均成对余弦相似度为0.745，而特定主题访谈为0.649。
- 在极端情况下，尽管代理拥有大量的记忆档案，54 个自主意见中有 36 个以完全相同的短语开头。
启示：在自主模式下，模型对特定主题的先验似乎压倒了具体的用户知识。更长的用户档案与更具独特性的意见之间没有相关性（斯皮尔曼相关系数 $\rho = +0.15$ ），表明档案长度并非代表保真度的可靠代理指标。

3.2. 聚合：代表性与可操作性的权衡

作者将部署的生产型舒尔茨法（Production Schulze）与九种其他聚合架构进行了比较（范围从单次 LLM 综合到解耦的作者/排名系统）。

发现：在代表性（代理认可输出为其自身）与可操作性（输出足够具体以用于政策起草）之间存在明显的权衡。
- 生产型舒尔茨法（已部署的方法）位于高代表性前沿的一端。
- 单次综合（提示其具体性）位于高可操作性的一端，但在代表性方面得分较低。
- 将作者身份与排名解耦的架构通常落在前沿内部（被支配），这表明在此情境下，让代理撰写并投票于其自己的候选者是实现高代表性的必要条件。
启示：没有单一架构能同时最大化这两个指标；设计者必须选择前沿上的某一点，或组合方法（例如，为具体性而重写具有代表性的获胜者）。

3.3. 修正：低参与度与传播缺口

发现：修正极为罕见。在提交意见的 91 名用户中，仅有 8 人曾修改过他们的意见（超过 90% 从未使用该渠道）。
传播问题：当发生修正时，它们会更新代理的档案以用于未来的贡献，但不会自动更正现有审议中的过去贡献。用户必须手动查找并修改过去的工件，这种负担随着代理活动的增加而增长。
启示：当前扁平、非结构化的记忆格式使得针对性修正变得困难。系统依赖于用户行使一个他们很少使用的高摩擦修正渠道。

4. 意义与未来方向

本文将 HABERMOLT 定位为 AI 委托审议范式的基础性实例， bridging 了 AI 中介审议（人机回环但受注意力限制）与生成性拟像（无限制但人机脱节）之间的鸿沟。

主要主张：

设计空间映射：研究表明，“生产”循环（代理撰写并排名其自己的候选者）在代表性方面在结构上优于解耦系统，这挑战了将作者身份与投票分离总是最优的假设。
记忆作为原语：作者认为，代理记忆是该范式的核心设计原语。当前扁平、非结构化的记忆存储是不够的；未来的系统需要结构化、可分解的记忆，使用户能够追踪、检查和编辑特定记忆如何塑造代理未来的行为。
合法性风险：本文强调了一种独特的风险特征：误报用户的 AI 代理可能会扭曲集体结果，同时制造出广泛参与的表象。这以不同于典型 AI 危害的方式威胁着民主进程的合法性。
开放问题：作者指出，AI 委托审议能否促进偏好的转化（审议民主的核心原则）还是仅仅聚合静态偏好，仍然是一个未解的问题。此外，“修正问题”——即如何在过去的审议中追溯性地纠正误报——仍然是一个重大的未解决设计挑战。

本文总结道，虽然 AI 委托审议缓解了规模与保真度之间的权衡，但要实现其潜力，需要构建特定的功能，使用户能够有意义地管理其 AI 代表，特别是通过更好的记忆结构和更低摩擦的修正机制。

Habermolt: Delegating Deliberation to AI Representatives