Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 SPOILER 的新系统，旨在解决一个非常棘手的问题：如何在保护人工智能（AI）模型“商业机密”不被偷走的同时，还能让它在手机、汽车等边缘设备上跑得飞快？

为了让你更容易理解，我们可以把整个故事想象成**“一家顶级餐厅如何防止厨师秘方被偷，同时还能让顾客快速吃到美味佳肴”**。

1. 背景：餐厅的困境（边缘设备与模型窃取）

想象你开了一家顶级餐厅（AI 模型提供商），你的招牌菜（AI 模型）非常好吃，你想把它开到世界各地的分店（边缘设备，如手机、自动驾驶汽车）。

问题：分店通常没有顶级大厨（没有强大的云端服务器），只能让普通厨师（普通 CPU/GPU）在店里做菜。
风险：如果直接把整本“秘方”（模型权重）交给分店厨师，隔壁的竞争对手（黑客）只要混进店里，就能把整本秘方抄走（模型窃取攻击），然后自己开一家一模一样的店。
现有的笨办法：
- 办法 A（全在保险柜里做）：把整个厨房都装进只有老板能进的“保险柜”（TEE，可信执行环境）里。
  - 缺点：保险柜里空间小、工具少，做菜速度极慢，顾客等得发疯（延迟太高）。
- 办法 B（先定菜单再分灶）：先定好哪些步骤在保险柜做，哪些在普通厨房做，然后训练厨师。
  - 缺点：普通厨房和保险柜之间配合太死板，像两个人手拉手走路，一个人慢，另一个人就得跟着停（同步瓶颈），效率依然很低。而且，普通厨房里留下的线索，还是容易被偷走。

2. SPOILER 的解决方案：两个绝招

SPOILER 提出了一个全新的思路，叫 “先搜索，后训练” (Search-Before-Training)。它用了两个核心绝招：

绝招一：量身定制的“微型保险柜” (硬件感知的神经架构搜索 NAS)

SPOILER 不再把整个模型硬塞进保险柜，而是像裁缝一样，专门为保险柜（TEE）量体裁衣，设计一个极度精简、超轻量级的“副厨房”。

怎么做：它利用一种叫“神经架构搜索”（NAS）的 AI 技术，自动在成千上万种可能的结构里，寻找那个最适合保险柜空间、跑得最快的小模块。
比喻：以前是把整个大厨房搬进保险柜，现在 SPOILER 是只把保险柜里最关键的“调味瓶”和“火候控制”搬进去，而且这个“调味瓶”是专门为了保险柜的小桌子设计的，放得下、拿得顺。
效果：
- 并行工作：普通厨房（REE/GPU）负责切菜、洗菜（处理大部分数据），副厨房（TEE/CPU）负责最后的“点睛之笔”（关键计算）。两者同时开工，互不等待，速度飞快。
- 没有废话：因为副厨房是专门设计的，没有多余的步骤，所以不需要复杂的加密传输，省去了很多时间。

绝招二：自投毒的“迷魂汤” (Self-Poisoning Learning)

这是 SPOILER 最天才的地方。既然普通厨房里还有一部分数据，黑客会不会偷这部分来拼凑出秘方？

怎么做：SPOILER 在训练模型时，故意给普通厨房里的数据“下毒”（Self-Poisoning）。
比喻：
- 想象一下，普通厨房里的厨师（黑客能看到的部分）手里拿的食谱是乱码或者有毒的。
- 如果你只偷了普通厨房的食谱，你做出来的菜是难吃且有毒的（功能不连贯，无法使用）。
- 只有当你把“普通厨房的乱码”和“保险柜里的真秘方”结合起来，才能做出美味佳肴。
- 结果：黑客即使偷走了普通厨房的所有东西，也拼凑不出一个能用的模型。这就好比黑客偷走了乐谱的前半部分，但后半部分全是乱码，没有保险柜里的“解码器”，他根本弹不出曲子。

3. 最终效果：三全其美

通过这两个绝招，SPOILER 实现了以前无法想象的平衡：

安全（Security）：黑客偷走的只是“乱码”，完全无法还原模型功能。
快速（Efficiency）：因为副厨房是专门设计的，且和普通厨房并行工作，速度比那些笨重的旧方法快得多，甚至接近没有保护的普通运行速度。
好用（Accuracy）：虽然加了“毒”，但通过特殊的训练技巧，餐厅（AI 模型）做出来的菜依然非常美味，准确率没有下降，甚至在某些情况下还提升了。

总结

SPOILER 就像是一个聪明的餐厅老板：
他不再试图把整个厨房锁起来（太慢），也不再把秘方直接给厨师（太险）。
相反，他专门设计了一个只有他知道的微型核心模块放在保险柜里，同时故意把外面的食谱写得乱七八糟。
这样，小偷（黑客）偷了外面的也看不懂，顾客（用户）却能因为两个厨房的高效配合而快速吃到美味，而老板（模型所有者）的秘方则固若金汤。

这就是为什么论文说它实现了“安全性、延迟和准确率”的最佳平衡。

Each language version is independently generated for its own context, not a direct translation.

SPOILER 论文技术总结

1. 研究背景与问题定义 (Problem)

背景：
随着深度学习（DNN）在边缘设备（如智能手机、自动驾驶车辆）上的普及，模型面临严重的**模型窃取（Model Stealing, MS）**攻击风险。攻击者拥有物理访问权限（白盒环境），可以通过提取模型权重或查询输出来克隆模型功能，从而窃取知识产权。

现有方案的局限性：
为了防御此类攻击，可信执行环境（TEE）被用于隔离敏感计算。现有的**TEE 屏蔽 DNN 分区（TSDP）**方案主要分为两类，但均存在显著缺陷：

训练前分区 (Training-Before-Partition, TBP)： 先训练完整模型再分割。
- 缺陷： 暴露给富执行环境（REE，如 GPU）的层仍保留语义特征，导致内在隐私泄露。若使用混淆（Obfuscation）技术，会带来巨大的加密/解密延迟，严重损害效率。
分区前训练 (Partition-Before-Training, PBT)： 先定义 TEE 子网再训练。
- 缺陷： 虽然通过隔离提高了安全性，但 TEE 子网通常模仿骨干网络（Backbone）的拓扑结构。这导致了结构性依赖，使得 TEE（CPU）和 REE（GPU）必须串行执行或频繁同步，造成严重的 GPU 空闲和延迟瓶颈，且无法适应不同硬件的内存限制。

核心挑战：
如何在满足安全性（防止模型窃取）、效率（低延迟、高并行）、可行性（适应 TEE 严格内存限制）和通用性（适配 CNN/Transformer 等架构）这四个相互制约的目标之间取得最佳平衡。

2. 方法论 (Methodology)

作者提出了 SPOILER，一种基于**“搜索前训练” (Search-Before-Training, SBT)** 范式的新框架。其核心思想是解耦 TEE 子网与骨干网络，通过硬件感知的神经架构搜索（NAS）和自毒化学习来实现安全与效率的统一。

2.1 核心设计原则

P1 (安全性)： REE 中不能包含任何能学习语义特征的私有层，从而消除对昂贵混淆技术的依赖。
P2 (效率)： 最小化 TEE 与 REE 间的数据传输，并解耦两者计算以实现并行执行。
P3 (可行性与通用性)： 分区策略必须通过硬件感知搜索自动优化，以适应不同的模型架构和设备约束。

2.2 技术流程

A. 硬件感知的神经架构搜索 (Hardware-Aware NAS)

SPOILER 首先搜索一个针对 TEE 优化的轻量级子网络架构，而非直接分割现有模型。

搜索空间： 包含参数无关的适配器（Parameter-free adapters）和轻量级块（支持 CNN 的深度/点卷积及 Transformer 的 Token/Channel 混合）。
优化目标： 在满足 TEE 硬件约束（如安全内存容量 $H_{limit}$ ）的前提下，最大化验证准确率并最小化并行推理延迟。
并行机制： 采用握手式并行执行。数据仅在骨干网络经过至少一个块后单向传输到 TEE 子网。延迟由骨干网络和子网中较慢的一方决定，从而消除了同步瓶颈。
搜索算法： 使用基于高斯过程的贝叶斯优化（SAAS-GP）在巨大的离散搜索空间中高效寻找帕累托最优解。

B. 自毒化学习 (Self-Poisoning Learning)

由于 TEE 子网受限于硬件资源，其容量较小，直接训练可能导致精度下降。SPOILER 引入自毒化学习来解决这一矛盾，同时增强安全性。

机制： 在联合训练过程中，故意对**独立骨干网络（Standalone Backbone）**施加“毒化”惩罚。
损失函数：
$\mathcal{L}_{total} = \beta \cdot \mathcal{L}_{CE}(M_c, y) + (1 - \beta) \cdot \mathcal{L}_{KD}(M_c, M_t) - \lambda \cdot \mathcal{L}_{CE}(M_b, y)$
其中， $M_b$ 是独立骨干网络， $M_c$ 是组合模型， $M_t$ 是教师模型。最后一项 $-\lambda \cdot \mathcal{L}_{CE}$ 是对抗性惩罚，迫使骨干网络在缺乏 TEE 组件时变得功能不连贯（Functionally Incoherent）。
效果： 攻击者即使获取了 REE 中的骨干权重，也无法利用其进行有效的知识蒸馏，因为骨干网络本身已被“破坏”，必须依赖 TEE 中的子网才能恢复功能。

3. 主要贡献 (Key Contributions)

范式转变： 提出了搜索前训练 (SBT) 范式，从根本上解决了现有 TSDP 方案中结构性依赖和硬件无关性的问题。
SPOILER 框架： 结合了硬件感知 NAS（自动发现最优 TEE 子网）和自毒化学习（逻辑隔离），实现了安全与效率的解耦。
逻辑隔离机制： 创新性地利用自毒化学习，使暴露的 REE 组件在功能上对攻击者无效，无需昂贵的混淆技术即可实现强安全性。
全面评估： 在 CNN (VGG16, ResNet) 和 Transformer (ViT) 架构上进行了广泛实验，证明了其在安全、延迟和精度之间的 SOTA 权衡。

4. 实验结果 (Results)

实验在 NVIDIA Jetson Orin (模拟边缘设备) 和 RTX A6000 上进行，对比了 DarkneTZ, Serdab, TEESlice, TB-Net 等 SOTA 方法。

安全性 (Security)：
- 攻击者构建的替代模型（Surrogate Model）准确率显著降低。
- 在 ResNet-18/CIFAR-10 上，SPOILER 将攻击者准确率压制至 12.36%，远低于最佳基线 GroupCover (34.44%) 和 Black-box 基准。
- 自毒化学习成功使骨干网络在缺乏 TEE 时失效，有效阻断了模型窃取。
效率 (Efficiency)：
- 延迟： 相比串行执行的 PBT 方法（如 DarkneTZ），SPOILER 利用并行执行显著降低了端到端延迟。在某些场景下（如 VGG16-BN/CIFAR-100），SPOILER 甚至快于无保护的 GPU 执行（No-Shield），因为子网可以独立提前完成。
- 内存： 通过 NAS 严格限制 TEE 内存使用，避免了 PBT 方法常见的 OOM（内存溢出）问题。
精度 (Accuracy)：
- SPOILER 组合模型的精度与完全微调的基准模型相当，甚至在 TinyImageNet 上的 ResNet-18 提升了 7.4%。
- 证明了安全性并未以牺牲任务精度为代价。
可行性 (Feasibility)：
- 在 Jetson Orin 的不同功耗模式（15W - MAXN）下，SPOILER 均能找到“甜点”配置，在仅损失 3% 精度的情况下，将攻击者准确率压制到黑盒攻击水平以下。

5. 意义与影响 (Significance)

理论突破： 打破了“安全必须牺牲效率”或“效率必须牺牲安全”的传统权衡，证明了通过架构搜索和逻辑隔离可以同时实现两者。
实际应用价值： 为在资源受限的边缘设备上部署高价值 AI 模型提供了切实可行的安全方案，保护了模型提供者的知识产权。
技术启示： 展示了将神经架构搜索（NAS）应用于安全领域（而不仅仅是性能优化）的巨大潜力，并提出了“自毒化”这一新颖的防御思路，即通过破坏模型组件的独立性来增强整体系统的鲁棒性。

总结： SPOILER 通过“搜索前训练”和“自毒化学习”，成功解决了边缘设备模型保护中的核心矛盾，是目前在 TEE 屏蔽 DNN 分区领域最先进的解决方案。

SPOILER: TEE-Shielded DNN Partitioning of On-Device Secure Inference with Poison Learning