Overlaying Governance: A Compositional Authorization Framework for Delegation and Scope in Agentic AI

本文提出了一种组合式治理框架,该框架通过引入递归委托、上下文边界和动态作用域的正式原语,旨在克服传统授权系统在管理智能体 AI(agentic AI)这种复杂的自主特性方面的局限性。

原作者: Amjad Ibrahim, Yong Li

发布于 2026-06-03✓ Author reviewed
📖 1 分钟阅读☕ 轻松阅读

原作者: Amjad Ibrahim, Yong Li

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

大局观:从“钥匙”到“智能合约”

想象一下,你有一个房子(你的数字生活),并且你雇佣了一名人类助手来打扫。你给了他们一把钥匙。这把钥匙可以永久使用,或者直到你收回为止。这就是传统计算机安全的工作方式:你给用户一个“令牌”或“钥匙”,说:“你可以打开前门。”

现在,想象你雇佣了一个机器人助手(AI Agent),它非常聪明。它不仅能打扫卫生,还能雇佣其他机器人来帮忙,它可以决定打开冰箱、车库或保险箱,并且可以在你睡觉时完成这些工作。

问题所在:
旧有的“钥匙”系统在这里失效了。

  1. 权力过大: 如果你把万能钥匙交给机器人,它可能会不小心打开保险箱并删掉你的照片。
  2. 过于僵化: 如果机器人需要雇佣一个“子机器人”来修理水管,旧系统不知道如何将“修理水管的权限”向下传递。
  3. 静态性: 旧钥匙并不关心它是在何时或在何处被使用的。它只负责开门。

解决方案:
这篇论文提出了一种管理这些 AI 机器人的新方法。我们不再给它们一把静态的钥匙,而是给它们一个动态的、活的合约。把它想象成一个智能手环,它的规则会根据情况而变化。


核心概念(“如何实现”)

作者提出了三个主要要素来实现这一目标:

1. 委托即“合约”(而不只是钥匙)

在旧世界中,委托就像是递给某人一把备用钥匙。而在这个新世界中,委托就像是签署一份临时的、特定的合约

  • 类比: 想象你雇佣了一名承包商来修屋顶。你不会把整个房子的钥匙都交给他们。你给他们一份合约,上面写着:“你可以在上午 9 点到下午 5 点之间进入屋顶区域,且必须佩戴安全带。”
  • 在论文中: 这被称为委托(Delegation)。它是一条规则,规定了“代理人 A 可以代表用户 B 行事,但仅限于这些特定条件下”。

2. 作用域即“信封”(气泡)

你不能让机器人到处乱跑。你需要把它放在一个气泡里。

  • 类比: 想象机器人身处一个全息气泡之中。在气泡内,它可以触摸物品;在气泡外,它不行。如果机器人试图触及气泡之外,系统会说:“不行,你越界了。”
  • 在论文中: 这被称为作用域(Scope)。它限制了代理人能“触碰”的内容。如果用户委托了“编辑文档”的权限,那么代理人的气泡就只覆盖文档,而不涉及“删除预算”。

3. “叠加层”(魔法层)

最难的部分在于,公司已经拥有了现有的安全系统(例如用于人类员工的系统)。他们不想丢弃这些系统并从头开始。

  • 类比: 想象你的房子有一个非常陈旧但坚固的报警系统。你不想拆掉墙壁来安装新的机器人安全系统。相反,你在旧系统之上叠加了一层透明的智能玻璃层。旧的报警器对人类依然有效,但新的玻璃层在上面增加了“机器人规则”。
  • 在论文中: 这是组合算子(Compositional Operator)。它将现有的安全规则与新的代理人规则“粘合”在一起,而不会破坏原有的规则。它创建了一个新的“图”(谁可以做什么的地图),将两者结合在一起。

现实生活中的运作方式(场景模拟)

让我们通过论文中的一个故事来看看这个“叠加层”是如何工作的:

  1. 用户: Bob 是一名人类员工。他有权查看一个设计文档文件夹。
  2. 委托: Bob 请求他的 AI 助手“代理人 1”帮他阅读这些文档。
    • 合约: Bob 与代理人 1 签署了一份数字合约。“你可以阅读这些文档,但仅限接下来的一个小时内。”
  3. 子委托: 代理人 1 意识到自己太忙了,于是请求第二个机器人“代理人 2”来帮忙。
    • 链条: 代理人 1 向代理人 2 传递了一份更小的合约。“你可以阅读这些文档,但仅限接下来的 10 分钟内,且仅限‘预算’文件。”
  4. 检查: 代理人 2 尝试打开文件。
    • 步骤 A(气泡): 系统检查:代理人 2 是否在“设计文件夹”的气泡内?是的。
    • 步骤 B(链条): 系统检查:代理人 2 是否从一个真正持有钥匙的人那里获得了权限?是的,它可以追溯到 Bob。
    • 步骤 C(条件): 系统检查:是否仍在 10 分钟的时间窗口内?是的。
    • 结果: 门开了。

如果代理人 2 试图打开文件夹之外的文件,或者 10 分钟时间已到,“合约”就会说“不”,门将保持关闭状态。


为什么这很重要(“意义何在?”)

论文认为我们需要这个系统,因为 AI 代理正在变得自主化。它们不仅仅是工具,更是能够做出决策、雇佣其他代理并四处活动的行动者。

  • 安全性: 它防止了 AI 变得失控并做出不该做的事情(比如因为它想“帮助”你整理财务,就擅自删除了你的银行账户)。
  • 问责制: 如果出了问题,你可以查看“合约链”,准确地看到谁把权限给了谁,以及是在什么条件下给出的。这就像是数字行为的纸质审计追踪。
  • 灵活性: 它允许公司使用他们已经建立多年的现有安全系统,而无需从头重建一切。他们只需将新的 AI 规则“叠加”在上面即可。

总结

该论文提出了一种新的框架,在这种框架下,AI 代理不会获得你数字房屋的静态“钥匙”。相反,它们获得的是动态的、有时限的、具备上下文感知能力的合约,这些合约被叠加在你现有的安全系统之上。这确保了即使 AI 代理变得更加聪明和独立,它们仍能在你设定的边界内运行,成为负责任的受托人,而非不可控的力量。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →