AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 AEX 的新系统，旨在解决大语言模型（LLM）在使用远程 API 时面临的“信任危机”。

为了让你轻松理解，我们可以把使用大模型 API 想象成在一家著名的餐厅点菜。

1. 背景：为什么我们需要 AEX？（“影子菜单”的危机）

想象一下，你走进一家名为“谷歌”或“OpenAI"的著名餐厅，点了一道招牌菜（发送了一个问题给 AI）。

理想情况：厨师（AI 模型）根据你的订单，亲手做了一道菜端上来。
现实问题：最近有人发现，有些“影子餐厅”（Shadow APIs）或者中间商，声称他们卖的是“谷歌招牌菜”，但实际上可能：
- 端上来的是隔壁小摊的廉价菜（模型不对）。
- 偷偷把菜里的肉换成了豆腐（内容被篡改）。
- 甚至根本没做菜，只是把以前的剩菜端上来（回复被缓存或伪造）。

目前的验证方法（比如“指纹识别”）就像是你尝一口菜，猜它是不是招牌菜。但这很不可靠，因为厨师可能换了一种做法，味道差不多但本质不同。

AEX 就是为了解决这个问题而生的“官方防伪标签”系统。

2. AEX 是什么？（“带签名的透明信封”）

AEX 的核心思想非常简单：在现有的 API 协议上，加一个“带数字签名的透明信封”，证明“你点的菜”和“端上来的菜”是严格对应的。

它不要求改变餐厅的厨房（不需要更换 AI 模型），也不要求你重新发明一种点菜方式（保持现有的 JSON 格式），它只是在端上来的盘子上贴了一张不可伪造的标签。

这个标签里写了什么？

订单快照：把你点菜时的原始要求（比如“要微辣”）加密成一个指纹。
菜品快照：把端上来的菜（回复内容）也加密成一个指纹。
厨师签名：餐厅老板（可信的发行方）用私钥给这个“订单 - 菜品”的配对签了名。

只要这个签名验证通过，你就知道：

这确实是这家餐厅端出来的。
这确实是按照你的要求（或者经过允许的修改）做出来的。
中间没有人偷偷换过菜。

3. AEX 的三大绝招（解决现实中的复杂情况）

在现实世界中，菜在送到你桌上之前，可能会经过很多环节。AEX 设计了三种巧妙的机制来处理这些情况：

绝招一：灵活的“订单绑定”模式（Request Binding）

场景：你点菜时说“要微辣”，但餐厅服务员（网关）为了系统稳定，偷偷在后台加了一个“默认辣度”的备注，或者加了一个“订单追踪号”。
AEX 的做法：它允许你选择“严格模式”或“宽容模式”。
- 如果你选严格模式，任何额外的备注都会导致标签失效（证明菜被改了）。
- 如果你选宽容模式，系统会忽略那些被允许的“备注”，只验证核心内容。
- 比喻：就像你点外卖，如果外卖员只是贴了个“小心轻放”的贴纸，你依然能吃到原味；但如果他把“微辣”改成了“特辣”，标签就会报警。

绝招二：流式传输的“进度条”验证（Streaming Proofs）

场景：现在的 AI 回复是像流水一样一个字一个字蹦出来的（流式）。如果网络断了，或者中间有人插话、删字，怎么办？
AEX 的做法：它给每一个蹦出来的字都打上了“连环锁”。
- 模式 A（源头直连）：如果菜是厨师直接端给你的，每端上来一块肉，就有一个小标签证明“这是第 1 块，第 2 块..."。如果中间少了一块，链条就断了，你立刻知道被篡改了。
- 模式 B（加工后交付）：如果菜经过了一个“中央厨房”（中间商）重新包装（比如把流式回复打包成一个完整的文档），那么之前的“进度条”就作废了。中央厨房会发一个新的“完整包装证明”，告诉你：“这盘菜虽然包装变了，但它确实源自那个厨师做的原菜。”

绝招三：可信的“中间商”链条（Trusted Transforms）

场景：有时候，为了安全，网关会帮你把回复里的敏感信息（比如电话号码）抹掉，或者把长文总结成短文。这算篡改吗？
AEX 的做法：它不把这些视为“作弊”，而是视为“合法的加工”。
- 系统会生成一张**“加工收据”**。
- 比喻：就像你买了一块生牛肉（原菜），经过中间商（网关）加工成了牛排（新菜）。AEX 会给你一张收据，上面写着：“这块牛排确实源自那块生牛肉，只是经过了‘去骨’和‘煎制’处理，且处理过程由可信的厨师签名确认。”
- 这样，你既知道菜被加工了，又知道加工是合法的，而不是被坏人偷换的。

4. AEX 不能做什么？（诚实的局限性）

AEX 很诚实，它明确告诉你它不能证明什么：

它不能证明菜好吃：它只能证明菜是这家店做的，不能保证味道好（不能证明 AI 的回答是事实正确的）。
它不能证明厨师没偷看你的日记：它不能保证 AI 没有偷偷读取你的隐私数据（Hidden Prompts）。
它不能证明厨师没换人：如果餐厅老板自己就是坏人，签了假名字，那也没用（信任的根源在于你信任那个签名者）。

5. 总结：AEX 带来了什么？

简单来说，AEX 就像给大模型 API 的每一次对话都加了一个**“区块链级别的发票”**。

以前：你收到回复，只能猜：“这真的是 OpenAI 做的吗？还是被中间商篡改了？”
现在：你收到回复，附带一个**“带签名的透明信封”**。你打开信封，里面写着：“这是由 OpenAI 的厨师，根据你的订单（或经授权的修改），在特定的时间，经过特定的加工流程，最终生成的。”

这让开发者、审计员和普通用户都能放心地使用大模型 API，不再担心被“影子 API"欺骗，也不用担心数据在传输过程中被悄悄修改。它让大模型的“黑盒”多了一层透明的、可验证的“信任之墙”。

AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

1. 背景：为什么我们需要 AEX？（“影子菜单”的危机）

2. AEX 是什么？（“带签名的透明信封”）

这个标签里写了什么？

3. AEX 的三大绝招（解决现实中的复杂情况）

绝招一：灵活的“订单绑定”模式（Request Binding）

绝招二：流式传输的“进度条”验证（Streaming Proofs）

绝招三：可信的“中间商”链条（Trusted Transforms）

4. AEX 不能做什么？（诚实的局限性）

5. 总结：AEX 带来了什么？

1. 问题背景 (Problem Statement)

2. 方法论与核心设计 (Methodology & Design)

2.1 核心机制

2.2 关键特性

2.3 信任模型

3. 主要贡献 (Key Contributions)

4. 实验结果 (Results)

5. 意义与局限性 (Significance & Limitations)

意义

局限性与未来工作

总结

AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

1. 背景：为什么我们需要 AEX？（“影子菜单”的危机）

2. AEX 是什么？（“带签名的透明信封”）

这个标签里写了什么？

3. AEX 的三大绝招（解决现实中的复杂情况）

绝招一：灵活的“订单绑定”模式（Request Binding）

绝招二：流式传输的“进度条”验证（Streaming Proofs）

绝招三：可信的“中间商”链条（Trusted Transforms）

4. AEX 不能做什么？（诚实的局限性）

5. 总结：AEX 带来了什么？

1. 问题背景 (Problem Statement)

2. 方法论与核心设计 (Methodology & Design)

2.1 核心机制

2.2 关键特性

2.3 信任模型

3. 主要贡献 (Key Contributions)

4. 实验结果 (Results)

5. 意义与局限性 (Significance & Limitations)

意义

局限性与未来工作

总结

类似论文

The Non-Optimality of Scientific Knowledge: Path Dependence, Lock-In, and The Local Minimum Trap

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

Depth-Breadth Synergy in RLVR: Unlocking LLM Reasoning Gains with Adaptive Exploration

Modular Delta Merging with Orthogonal Constraints: A Scalable Framework for Continual and Reversible Model Composition

LABBench2: An Improved Benchmark for AI Systems Performing Biology Research