AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

本文提出了 AEX,一种针对现有 LLM API 的非侵入式扩展方案,通过添加签名证明对象来建立客户端请求与模型输出(包括流式传输和中间件重写场景)之间的可验证绑定,从而解决远程 API 输出真实性与溯源问题。

Yongjie Guan

发布于 2026-03-17
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 AEX 的新系统,旨在解决大语言模型(LLM)在使用远程 API 时面临的“信任危机”。

为了让你轻松理解,我们可以把使用大模型 API 想象成在一家著名的餐厅点菜

1. 背景:为什么我们需要 AEX?(“影子菜单”的危机)

想象一下,你走进一家名为“谷歌”或“OpenAI"的著名餐厅,点了一道招牌菜(发送了一个问题给 AI)。

  • 理想情况:厨师(AI 模型)根据你的订单,亲手做了一道菜端上来。
  • 现实问题:最近有人发现,有些“影子餐厅”(Shadow APIs)或者中间商,声称他们卖的是“谷歌招牌菜”,但实际上可能:
    • 端上来的是隔壁小摊的廉价菜(模型不对)。
    • 偷偷把菜里的肉换成了豆腐(内容被篡改)。
    • 甚至根本没做菜,只是把以前的剩菜端上来(回复被缓存或伪造)。

目前的验证方法(比如“指纹识别”)就像是你尝一口菜,猜它是不是招牌菜。但这很不可靠,因为厨师可能换了一种做法,味道差不多但本质不同。

AEX 就是为了解决这个问题而生的“官方防伪标签”系统。


2. AEX 是什么?(“带签名的透明信封”)

AEX 的核心思想非常简单:在现有的 API 协议上,加一个“带数字签名的透明信封”,证明“你点的菜”和“端上来的菜”是严格对应的。

它不要求改变餐厅的厨房(不需要更换 AI 模型),也不要求你重新发明一种点菜方式(保持现有的 JSON 格式),它只是在端上来的盘子上贴了一张不可伪造的标签

这个标签里写了什么?

  1. 订单快照:把你点菜时的原始要求(比如“要微辣”)加密成一个指纹。
  2. 菜品快照:把端上来的菜(回复内容)也加密成一个指纹。
  3. 厨师签名:餐厅老板(可信的发行方)用私钥给这个“订单 - 菜品”的配对签了名。

只要这个签名验证通过,你就知道:

  • 这确实是这家餐厅端出来的。
  • 这确实是按照你的要求(或者经过允许的修改)做出来的。
  • 中间没有人偷偷换过菜。

3. AEX 的三大绝招(解决现实中的复杂情况)

在现实世界中,菜在送到你桌上之前,可能会经过很多环节。AEX 设计了三种巧妙的机制来处理这些情况:

绝招一:灵活的“订单绑定”模式(Request Binding)

  • 场景:你点菜时说“要微辣”,但餐厅服务员(网关)为了系统稳定,偷偷在后台加了一个“默认辣度”的备注,或者加了一个“订单追踪号”。
  • AEX 的做法:它允许你选择“严格模式”或“宽容模式”。
    • 如果你选严格模式,任何额外的备注都会导致标签失效(证明菜被改了)。
    • 如果你选宽容模式,系统会忽略那些被允许的“备注”,只验证核心内容。
    • 比喻:就像你点外卖,如果外卖员只是贴了个“小心轻放”的贴纸,你依然能吃到原味;但如果他把“微辣”改成了“特辣”,标签就会报警。

绝招二:流式传输的“进度条”验证(Streaming Proofs)

  • 场景:现在的 AI 回复是像流水一样一个字一个字蹦出来的(流式)。如果网络断了,或者中间有人插话、删字,怎么办?
  • AEX 的做法:它给每一个蹦出来的字都打上了“连环锁”。
    • 模式 A(源头直连):如果菜是厨师直接端给你的,每端上来一块肉,就有一个小标签证明“这是第 1 块,第 2 块..."。如果中间少了一块,链条就断了,你立刻知道被篡改了。
    • 模式 B(加工后交付):如果菜经过了一个“中央厨房”(中间商)重新包装(比如把流式回复打包成一个完整的文档),那么之前的“进度条”就作废了。中央厨房会发一个新的“完整包装证明”,告诉你:“这盘菜虽然包装变了,但它确实源自那个厨师做的原菜。”

绝招三:可信的“中间商”链条(Trusted Transforms)

  • 场景:有时候,为了安全,网关会帮你把回复里的敏感信息(比如电话号码)抹掉,或者把长文总结成短文。这算篡改吗?
  • AEX 的做法:它不把这些视为“作弊”,而是视为“合法的加工”。
    • 系统会生成一张**“加工收据”**。
    • 比喻:就像你买了一块生牛肉(原菜),经过中间商(网关)加工成了牛排(新菜)。AEX 会给你一张收据,上面写着:“这块牛排确实源自那块生牛肉,只是经过了‘去骨’和‘煎制’处理,且处理过程由可信的厨师签名确认。”
    • 这样,你既知道菜被加工了,又知道加工是合法的,而不是被坏人偷换的。

4. AEX 不能做什么?(诚实的局限性)

AEX 很诚实,它明确告诉你它不能证明什么:

  • 它不能证明菜好吃:它只能证明菜是这家店做的,不能保证味道好(不能证明 AI 的回答是事实正确的)。
  • 它不能证明厨师没偷看你的日记:它不能保证 AI 没有偷偷读取你的隐私数据(Hidden Prompts)。
  • 它不能证明厨师没换人:如果餐厅老板自己就是坏人,签了假名字,那也没用(信任的根源在于你信任那个签名者)。

5. 总结:AEX 带来了什么?

简单来说,AEX 就像给大模型 API 的每一次对话都加了一个**“区块链级别的发票”**。

  • 以前:你收到回复,只能猜:“这真的是 OpenAI 做的吗?还是被中间商篡改了?”
  • 现在:你收到回复,附带一个**“带签名的透明信封”**。你打开信封,里面写着:“这是由 OpenAI 的厨师,根据你的订单(或经授权的修改),在特定的时间,经过特定的加工流程,最终生成的。”

这让开发者、审计员和普通用户都能放心地使用大模型 API,不再担心被“影子 API"欺骗,也不用担心数据在传输过程中被悄悄修改。它让大模型的“黑盒”多了一层透明的、可验证的“信任之墙”。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →