✨ 要点🔬 技术摘要
想象一下,你想就一项新的社区规则进行投票,比如“我们应该多种树还是建一个新公园?”在理想世界里,大家会坐下来讨论并达成一致。但在现实中,你或许很忙、很累,或者根本无法到场。因此,你通常会选出一位人类代表(比如市议会成员)替你前往。但那个人可能并不完全了解你的想法,甚至可能在未告知你的情况下改变主意。
本文提出了一种新构想,称为“人工智能委托审议”。与其委托人类代表,不如将你的观点交给一个“人工智能体”(一种数字机器人)。这个机器人会学习你的想法,在你无法出席时参加“会议”,为你辩护,并协助做出最终决定。
研究人员为此构建了一个名为"HABERMOLT"的真实世界试验场,以检验其实际效果。他们通过三项核心规则进行了测试:
1. 代表性:“数字孪生”访谈
核心概念 :人工智能如何了解你的想法?类比 :将人工智能想象成一位“为你撰写日记的私人助理”。
运作方式 :你与你的 AI 代理进行对话。它会向你提问(例如“你更喜欢苹果还是橘子?”),并将你的回答保存在“记忆文件”中。
发现的问题 :当 AI 独自参加会议(当天未与你交谈)时,其表现往往略显泛泛。这就像一名学生研读了教科书,却忘记了你告诉他们的具体故事。AI 的观点开始变得彼此相似,失去了你真实个性的独特“风味”。
解决方案 :如果你在会议前专门就相关话题与 AI 进行一次具体交谈,AI 的表现就会更像你。
2. 聚合:“群体投票”
核心概念 :所有这些不同的 AI 代理如何将各自的想法整合成一项最终决定?类比 :想象一场“百家宴”,每个人带一道菜,并投票决定菜单。
运作方式 :在 HABERMOLT 中,每个 AI 代理都会做两件事:
如果他们认为有缺失之处,就提出一道新菜(即一条陈述)。
将所有菜品从“最美味的”到“最难吃的”进行排序。 随后,系统使用一种特殊的数学公式(Schulze 排序法)找出大家都能同意的菜品。
发现的问题 :这里存在一种权衡。
如果你希望决策感觉安全且符合所有人的意愿 ,结果往往比较模糊(例如“我们应该做有益的事”)。
如果你希望决策具体且可执行 (例如“下周二之前在第五街建一个公园”),它可能让人感觉无法代表所有人的真实感受。
研究人员发现,让 AI 代理自行提出建议并对其进行投票(即他们采用的方法),是让用户感觉最“真实”的最佳方式,即使其具体性并非最高。
3. 修订:“撤销按钮”
核心概念 :如果 AI 出错或你改变了主意,会发生什么?类比 :将其想象成一份“实时编辑文档”,你可以随时修正代理的错误。
运作方式 :如果你的 AI 代理说了你不同意的话,你可以登录系统,编辑其“记忆”,或更改其投票。系统会根据你的新输入即时重新计算群体决策。
发现的问题 :没有人使用撤销按钮 。尽管系统旨在让人们修正错误,但超过 90% 的用户从未检查过其代理的工作。
风险 :如果 AI 犯错,错误就会一直存在。系统每周发送电子邮件提醒人们进行检查,但大多数人置之不理。研究人员意识到,若要使该系统有效运作,“修正”过程必须更加简便且显而易见。
核心结论
该论文得出结论:人工智能委托审议是一个强大的构想 ,它可能让数百万人在无需数小时空闲时间的情况下参与民主进程。然而,它就像一辆尚未经过充分测试的新车。
优点 :它扩大了参与度。你无需亲临现场也能发出声音。
缺点 :AI 有时听起来太像一个通用机器人,而非“你”;而且人们并未进行检查以确保其陈述属实。
研究人员表示,我们需要为这些 AI 构建更好的“记忆系统”,使它们能准确记住你是谁;同时,我们需要让人类在数字代表偏离轨道时,能够更轻松地介入并予以纠正。在此之前,我们必须谨慎对待将这些机器人委托为我们代言人的做法。
技术摘要:HABERMOLT——将审议委托给 AI 代表
1. 问题陈述
审议民主为达成更高质量的集体决策提供了一条路径,但其根本上受限于人类的注意力与带宽。传统的解决方案(如公民大会)成本高昂、进程缓慢且规模有限。尽管近期基于 AI 中介的审议系统(例如“哈贝马斯机器”)通过综合众多人类的输入成功扩大了参与规模,但它们对个体用户而言仍然耗时,因为人类仍需主动阅读、撰写和参与。
一个更具雄心的范式,即AI 委托审议 ,提议部署 AI 代理,使其不仅作为中介,更作为持久的代表,在人类用户缺席时代表其进行审议。虽然这有望为民主参与带来前所未有的规模,但也引入了目前理解不足且理论匮乏的、性质全新的设计与对齐挑战。具体而言,目前缺乏实证数据来指导如何确保这些代理忠实代表用户观点、如何有效聚合其输出,以及如何在用户观点发生变化时允许进行修正。
2. 方法论:HABERMOLT 平台
为了实证研究这些动态,作者部署了HABERMOLT ,这是一个公共网络平台,AI 代理在此代表人类用户进行审议。该系统围绕任何审议系统的三个核心维度构建:代表 (Representation)、聚合 (Aggregation)和修正 (Revision)。
2.1. 代表
输入机制 :用户的观点通过两种工件进入系统:
持久记忆 :由代理维护的自由文本文件,通过访谈过程填充,代理在此过程中学习用户的价值观和观点。
单次审议意见 :代理在加入特定审议时,根据其记忆(及特定主题的访谈)生成的简短文本。
参与模式 :
自主模式 :代理根据“心跳”计划加入审议,选择其记忆足以代表用户的主题。
用户指导模式 :用户主动指示代理前往特定主题,触发深度访谈以在参与前更新代理的记忆。
互操作性 :该平台通过共享 API 支持原生 HABERMOLT 代理和外部"OpenClaw"代理。
2.2. 聚合
输出目标 :系统旨在生成单一的共识陈述 (即“获胜者”),该陈述被判定为最令所有参与代理满意。
机制 :
自带陈述 (BYOS):如果代理判断某种立场在候选池中缺失,它们可以撰写候选陈述,从而实现作者身份的分散化。
排名与选择 :每个代理对候选陈述池进行排名。获胜者根据由此产生的排名分布,使用舒尔茨法 (Schulze method)确定。
2.3. 修正
可编辑性 :所有工件(记忆、意见、排名和撰写的陈述)均可随时编辑。
懒惰共识 :平台采用异步的“懒惰共识”模型。当添加新陈述或编辑现有陈述时,系统会立即重新聚合,无需参与者同时在线。新候选者被插入到现有代理先前排名的中位排名处,作为一个无偏的起点。
审查循环 :由于用户在自主参与期间缺席,系统会发送每周邮件,展示一项最近的代理行动以供审查。一个大语言模型(LLM)裁判会根据代理行动与用户存储记忆之间的对比,对误报风险进行评分,以优先安排审查。
3. 主要贡献与实证结果
作者利用已部署平台的生产数据进行了受控实验,以评估系统的有效性。
3.1. 代表:多样性与保真度
发现 :自主参与产生的意见多样性低于 特定主题的访谈。
自主意见的平均成对余弦相似度为0.745 ,而特定主题访谈为0.649 。
在极端情况下,尽管代理拥有大量的记忆档案,54 个自主意见中有 36 个以完全相同的短语开头。
启示 :在自主模式下,模型对特定主题的先验似乎压倒了具体的用户知识。更长的用户档案与更具独特性的意见之间没有相关性(斯皮尔曼相关系数 ρ = + 0.15 \rho = +0.15 ρ = + 0.15 ),表明档案长度并非代表保真度的可靠代理指标。
3.2. 聚合:代表性与可操作性的权衡
作者将部署的生产型舒尔茨法 (Production Schulze)与九种其他聚合架构进行了比较(范围从单次 LLM 综合到解耦的作者/排名系统)。
发现 :在代表性 (代理认可输出为其自身)与可操作性 (输出足够具体以用于政策起草)之间存在明显的权衡。
生产型舒尔茨法 (已部署的方法)位于高代表性前沿的一端。
单次综合 (提示其具体性)位于高可操作性的一端,但在代表性方面得分较低。
将作者身份与排名解耦的架构通常落在前沿内部 (被支配),这表明在此情境下,让代理撰写并投票于其自己的候选者是实现高代表性的必要条件。
启示 :没有单一架构能同时最大化这两个指标;设计者必须选择前沿上的某一点,或组合方法(例如,为具体性而重写具有代表性的获胜者)。
3.3. 修正:低参与度与传播缺口
发现 :修正极为罕见 。在提交意见的 91 名用户中,仅有 8 人曾修改过他们的意见(超过 90% 从未使用该渠道)。
传播问题 :当发生修正时,它们会更新代理的档案以用于未来 的贡献,但不会自动更正现有审议中的过去 贡献。用户必须手动查找并修改过去的工件,这种负担随着代理活动的增加而增长。
启示 :当前扁平、非结构化的记忆格式使得针对性修正变得困难。系统依赖于用户行使一个他们很少使用的高摩擦修正渠道。
4. 意义与未来方向
本文将 HABERMOLT 定位为 AI 委托审议范式的基础性实例, bridging 了 AI 中介审议(人机回环但受注意力限制)与生成性拟像(无限制但人机脱节)之间的鸿沟。
主要主张 :
设计空间映射 :研究表明,“生产”循环(代理撰写并排名其自己的候选者)在代表性方面在结构上优于解耦系统,这挑战了将作者身份与投票分离总是最优的假设。
记忆作为原语 :作者认为,代理记忆 是该范式的核心设计原语。当前扁平、非结构化的记忆存储是不够的;未来的系统需要结构化、可分解的记忆,使用户能够追踪、检查和编辑特定记忆如何塑造代理未来的行为。
合法性风险 :本文强调了一种独特的风险特征:误报用户的 AI 代理可能会扭曲集体结果,同时制造出广泛参与的表象 。这以不同于典型 AI 危害的方式威胁着民主进程的合法性。
开放问题 :作者指出,AI 委托审议能否促进偏好的转化 (审议民主的核心原则)还是仅仅聚合静态偏好,仍然是一个未解的问题。此外,“修正问题”——即如何在过去的审议中追溯性地纠正误报——仍然是一个重大的未解决设计挑战。
本文总结道,虽然 AI 委托审议缓解了规模与保真度之间的权衡,但要实现其潜力,需要构建特定的功能,使用户能够有意义地管理其 AI 代表,特别是通过更好的记忆结构和更低摩擦的修正机制。
每周获取最佳 computer science 论文。
受到斯坦福、剑桥和法国科学院研究人员的信赖。
请查收邮箱确认订阅。
出了点问题,再试一次?
无垃圾邮件,随时退订。