Governed Collaborative Memory as Artificial Selection in LLM-Based… — 通俗解释

原作者： Diego F. Cuadros, Abdoul-Aziz Maiga, Helen Meskhidze, Andre Curtis-Trudel

发布于 2026-05-07

📖 1 分钟阅读☕ 轻松阅读

原作者： Diego F. Cuadros, Abdoul-Aziz Maiga, Helen Meskhidze, Andre Curtis-Trudel

原始论文采用 CC BY 4.0 许可（http://creativecommons.org/licenses/by/4.0/）。 ✨ 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性，请参阅原始论文。阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象一个 AI 助手团队正在共同开展一项长期项目。过去，这些 AI 就像在单次咖啡聊天中相遇的陌生人：它们交谈、提供建议，然后在会议结束后遗忘一切。它们没有关于“自己是谁”或“学到了什么”的“记忆”。

但现在，这些 AI 正在获得持久记忆。它们可以记住昨天的教训，为明天存储规则，并将知识传递给队友。这固然很好，但也带来了一个新问题：谁有权决定什么能成为团队永久历史的一部分？

如果 AI 犯了一个错误，写了一个有趣但错误的故事，或者养成了一种坏习惯，这是否应该成为整个团队的永久规则？还是应该保持私密？

本文认为，我们需要一个**“受治理的协作记忆”系统。不要把它仅仅看作一个文件柜，而要看作一个选择过程**——就像博物馆策展人决定哪些文物展出、哪些留在地下室一样。

以下是他们观点的分解，使用了简单的类比：

如果没有规则，AI 可能会保存它认为有趣的一切。

作者建议我们不应以相同的方式对待所有记忆。相反，我们应该将其组织成房子里四个不同的“房间”，每个房间对准入内容有不同的规则：

房间 1：个人储物柜（代理本地记忆）
- 是什么：特定于单个 AI 角色的私人笔记。
- 类比：厨师的个人食谱或机械师特定的工具偏好。
- 原因：如果我们强迫厨师和机械师共享完全相同的笔记，厨师可能会开始修车，而机械师可能会开始做饭。我们需要保持它们独特的“身份”分离，以便它们能继续胜任各自的工作。
房间 2：市政厅（共享机构记忆）
- 是什么：整个团队的官方永久规则和教训。
- 类比：城市的正式法律或公司的手册。
- 规则：除非通过严格的“治理”检查，否则没有任何东西能进入这里。仅凭 AI 认为这是一个好主意是不够的；它需要证据和批准。
房间 3：档案馆（归档记忆）
- 是什么：旧历史、研究和背景信息。
- 类比：图书馆的地下室或博物馆的存储库。
- 规则：你可以查看这些项目，但它们不是活跃的规则。我们不需要在有人阅读旧报纸剪报之前对每一份进行投票，但我们必须知道它们的来源。
房间 4：白板（项目连续性记忆）
- 是什么：当前任务的临时笔记。
- 类比：贴在办公桌上用于当天会议的便利贴。
- 规则：项目完成后，这些内容会被擦除或转移。它们不应意外地与市政厅中的永久法律混合在一起。

本文比较了决定什么进入“市政厅”（共享记忆）的不同方式：

“全收”方法（无治理）：快速，但危险。虚假会变为永久事实。
“测试分数”方法（自动）：AI 检查记忆是否能提高数学分数或速度。这对数字有效，但对“诚实”或“公平”之类的事情无效。
“规则手册”方法（宪法式）：AI 遵循一套人类编写的规则（如“不要撒谎”）。它具有可扩展性，但可能会忽略细微差别。
“人类法官”方法（人类批准的人工选择）：人类（或人类主导的过程）查看候选记忆并说：“是的，这是真实且重要的；让我们将其正式化。”
- 为何重要：人类更擅长判断那些无法通过分数衡量的事物，例如“这个 AI 听起来可信吗？”或“这是否符合我们团队的价值观？”

作者在现实世界的 AI 系统中测试了这一想法。他们发现：

本文并非主张“人类必须检查每一个记忆”。相反，它指出：我们需要有意识地选择如何筛选记忆。

我们需要问：

如果我们不回答这些问题，我们可能会构建出高效但容易重复自身谎言、失去独特技能或变成一团混乱、相同的数据块的 AI 团队。目标是使记忆变得可检查、可纠正且诚实。

Governed Collaborative Memory as Artificial Selection in LLM-Based Multi-Agent Systems