Habermolt: Delegating Deliberation to AI Representatives

本文介绍了 Habermolt,这是一个用于 AI 代理委托审议的公共平台,其中代理人在集体决策中代表人类,并通过代表性、聚合与修订三个维度评估其有效性,以应对可扩展且可信赖的 AI 代表所面临的全新设计与对齐挑战。

原作者: Joseph Low, Oscar Duys, Claude Formanek, Michiel Bakker, Lewis Hammond

发布于 2026-05-26✓ Author reviewed
📖 1 分钟阅读☕ 轻松阅读

原作者: Joseph Low, Oscar Duys, Claude Formanek, Michiel Bakker, Lewis Hammond

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你想就一项新的社区规则进行投票,比如“我们应该多种树还是建一个新公园?”在理想世界里,大家会坐下来讨论并达成一致。但在现实中,你或许很忙、很累,或者根本无法到场。因此,你通常会选出一位人类代表(比如市议会成员)替你前往。但那个人可能并不完全了解你的想法,甚至可能在未告知你的情况下改变主意。

本文提出了一种新构想,称为“人工智能委托审议”。与其委托人类代表,不如将你的观点交给一个“人工智能体”(一种数字机器人)。这个机器人会学习你的想法,在你无法出席时参加“会议”,为你辩护,并协助做出最终决定。

研究人员为此构建了一个名为"HABERMOLT"的真实世界试验场,以检验其实际效果。他们通过三项核心规则进行了测试:

1. 代表性:“数字孪生”访谈

核心概念:人工智能如何了解你的想法?
类比:将人工智能想象成一位“为你撰写日记的私人助理”。

  • 运作方式:你与你的 AI 代理进行对话。它会向你提问(例如“你更喜欢苹果还是橘子?”),并将你的回答保存在“记忆文件”中。
  • 发现的问题:当 AI 独自参加会议(当天未与你交谈)时,其表现往往略显泛泛。这就像一名学生研读了教科书,却忘记了你告诉他们的具体故事。AI 的观点开始变得彼此相似,失去了你真实个性的独特“风味”。
  • 解决方案:如果你在会议前专门就相关话题与 AI 进行一次具体交谈,AI 的表现就会更像你。

2. 聚合:“群体投票”

核心概念:所有这些不同的 AI 代理如何将各自的想法整合成一项最终决定?
类比:想象一场“百家宴”,每个人带一道菜,并投票决定菜单。

  • 运作方式:在 HABERMOLT 中,每个 AI 代理都会做两件事:
    1. 如果他们认为有缺失之处,就提出一道新菜(即一条陈述)。
    2. 将所有菜品从“最美味的”到“最难吃的”进行排序。
      随后,系统使用一种特殊的数学公式(Schulze 排序法)找出大家都能同意的菜品。
  • 发现的问题:这里存在一种权衡。
    • 如果你希望决策感觉安全且符合所有人的意愿,结果往往比较模糊(例如“我们应该做有益的事”)。
    • 如果你希望决策具体且可执行(例如“下周二之前在第五街建一个公园”),它可能让人感觉无法代表所有人的真实感受。
    • 研究人员发现,让 AI 代理自行提出建议并对其进行投票(即他们采用的方法),是让用户感觉最“真实”的最佳方式,即使其具体性并非最高。

3. 修订:“撤销按钮”

核心概念:如果 AI 出错或你改变了主意,会发生什么?
类比:将其想象成一份“实时编辑文档”,你可以随时修正代理的错误。

  • 运作方式:如果你的 AI 代理说了你不同意的话,你可以登录系统,编辑其“记忆”,或更改其投票。系统会根据你的新输入即时重新计算群体决策。
  • 发现的问题没有人使用撤销按钮。尽管系统旨在让人们修正错误,但超过 90% 的用户从未检查过其代理的工作。
  • 风险:如果 AI 犯错,错误就会一直存在。系统每周发送电子邮件提醒人们进行检查,但大多数人置之不理。研究人员意识到,若要使该系统有效运作,“修正”过程必须更加简便且显而易见。

核心结论

该论文得出结论:人工智能委托审议是一个强大的构想,它可能让数百万人在无需数小时空闲时间的情况下参与民主进程。然而,它就像一辆尚未经过充分测试的新车。

  • 优点:它扩大了参与度。你无需亲临现场也能发出声音。
  • 缺点:AI 有时听起来太像一个通用机器人,而非“你”;而且人们并未进行检查以确保其陈述属实。

研究人员表示,我们需要为这些 AI 构建更好的“记忆系统”,使它们能准确记住你是谁;同时,我们需要让人类在数字代表偏离轨道时,能够更轻松地介入并予以纠正。在此之前,我们必须谨慎对待将这些机器人委托为我们代言人的做法。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →