Governed Collaborative Memory as Artificial Selection in LLM-Based Multi-Agent Systems

本文将基于大语言模型的多智能体系统中持久性记忆的选择挑战框架化为“受治理的协作记忆”,提出一项将记忆治理视为人工选择机制的设计议程,以确保认知质量、来源保真度和可追溯的制度状态,而非仅仅依赖检索准确性。

原作者: Diego F. Cuadros, Abdoul-Aziz Maiga, Helen Meskhidze, Andre Curtis-Trudel

发布于 2026-05-07
📖 1 分钟阅读☕ 轻松阅读

原作者: Diego F. Cuadros, Abdoul-Aziz Maiga, Helen Meskhidze, Andre Curtis-Trudel

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象一个 AI 助手团队正在共同开展一项长期项目。过去,这些 AI 就像在单次咖啡聊天中相遇的陌生人:它们交谈、提供建议,然后在会议结束后遗忘一切。它们没有关于“自己是谁”或“学到了什么”的“记忆”。

但现在,这些 AI 正在获得持久记忆。它们可以记住昨天的教训,为明天存储规则,并将知识传递给队友。这固然很好,但也带来了一个新问题:谁有权决定什么能成为团队永久历史的一部分?

如果 AI 犯了一个错误,写了一个有趣但错误的故事,或者养成了一种坏习惯,这是否应该成为整个团队的永久规则?还是应该保持私密?

本文认为,我们需要一个**“受治理的协作记忆”系统。不要把它仅仅看作一个文件柜,而要看作一个选择过程**——就像博物馆策展人决定哪些文物展出、哪些留在地下室一样。

以下是他们观点的分解,使用了简单的类比:

1. 问题:记忆的“狂野西部”

如果没有规则,AI 可能会保存它认为有趣的一切

  • 类比:想象一个学生在日记本里写下每一个念头,包括拼写错误、白日梦和虚假事实。如果它们后来阅读这本日记来决定该做什么,可能会依据自己偶然写下的谎言采取行动。
  • 风险:在 AI 术语中,这被称为“无治理的持久性”。一个虚假记忆被保存、重新加载并重复,直到它成为整个系统永久且不可更改的“事实”。

2. 解决方案:四种不同的“记忆层”

作者建议我们不应以相同的方式对待所有记忆。相反,我们应该将其组织成房子里四个不同的“房间”,每个房间对准入内容有不同的规则:

  • 房间 1:个人储物柜(代理本地记忆)

    • 是什么:特定于单个 AI 角色的私人笔记。
    • 类比:厨师的个人食谱或机械师特定的工具偏好。
    • 原因:如果我们强迫厨师和机械师共享完全相同的笔记,厨师可能会开始修车,而机械师可能会开始做饭。我们需要保持它们独特的“身份”分离,以便它们能继续胜任各自的工作。
  • 房间 2:市政厅(共享机构记忆)

    • 是什么:整个团队的官方永久规则和教训。
    • 类比:城市的正式法律或公司的手册。
    • 规则:除非通过严格的“治理”检查,否则没有任何东西能进入这里。仅凭 AI 认为这是一个好主意是不够的;它需要证据和批准。
  • 房间 3:档案馆(归档记忆)

    • 是什么:旧历史、研究和背景信息。
    • 类比:图书馆的地下室或博物馆的存储库。
    • 规则:你可以查看这些项目,但它们不是活跃的规则。我们不需要在有人阅读旧报纸剪报之前对每一份进行投票,但我们必须知道它们的来源。
  • 房间 4:白板(项目连续性记忆)

    • 是什么:当前任务的临时笔记。
    • 类比:贴在办公桌上用于当天会议的便利贴。
    • 规则:项目完成后,这些内容会被擦除或转移。它们不应意外地与市政厅中的永久法律混合在一起。

3. “选择”如何运作

本文比较了决定什么进入“市政厅”(共享记忆)的不同方式:

  • “全收”方法(无治理):快速,但危险。虚假会变为永久事实。
  • “测试分数”方法(自动):AI 检查记忆是否能提高数学分数或速度。这对数字有效,但对“诚实”或“公平”之类的事情无效。
  • “规则手册”方法(宪法式):AI 遵循一套人类编写的规则(如“不要撒谎”)。它具有可扩展性,但可能会忽略细微差别。
  • “人类法官”方法(人类批准的人工选择):人类(或人类主导的过程)查看候选记忆并说:“是的,这是真实且重要的;让我们将其正式化。”
    • 为何重要:人类更擅长判断那些无法通过分数衡量的事物,例如“这个 AI 听起来可信吗?”或“这是否符合我们团队的价值观?”

4. 证据表明了什么

作者在现实世界的 AI 系统中测试了这一想法。他们发现:

  • 错误会发生:即使有规则,AI 仍可能编造虚假故事。
  • 系统会学习:系统不是简单地删除错误,而是记录了为什么它是错误的,并制定了新规则以防止下次发生。
  • 身份保持安全:新的 AI 团队成员可以加入并学习团队规则,而不会失去自己独特的个性。
  • 透明度:系统保留了“纸质记录”,显示哪些记忆被拒绝、哪些被修订、哪些被批准。你可以看到决策的历史,而不仅仅是最终结果。

核心要点

本文并非主张“人类必须检查每一个记忆”。相反,它指出:我们需要有意识地选择如何筛选记忆。

我们需要问:

  1. 什么值得保存?(一个事实?一种感觉?一条规则?)
  2. 决定它足够好,可以成为永久性的?(一次测试?一本规则手册?一个人?)
  3. 如何将 AI 独特的个性与团队的共享知识区分开来?

如果我们不回答这些问题,我们可能会构建出高效但容易重复自身谎言、失去独特技能或变成一团混乱、相同的数据块的 AI 团队。目标是使记忆变得可检查、可纠正且诚实

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →