Designing to Forget: Deep Semi-parametric Models for Unlearning

该论文提出了一类具有非参数化卸载特性的深度半参数模型(SPMs),通过融合模块在测试阶段直接聚合样本信息以实现无需更新模型参数的显式删除,从而在保持图像分类与生成任务竞争力的同时,显著提升了机器遗忘的效率与效果。

Amber Yijia Zheng, Yu-Shan Tai, Raymond A. Yeh

发布于 2026-03-25
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种名为**“设计遗忘”(Designing to Forget, DTF)**的新方法,旨在解决人工智能(AI)中一个非常棘手的问题:如何让 AI 真正“忘记”它学过的某些特定数据。

想象一下,现在的 AI 就像一个读过全世界所有书的学生。如果有一天,有人要求这个学生“忘记”某本特定的书(比如因为隐私原因),传统的做法非常麻烦:要么把整本书撕了,然后让学生重新把剩下的书全部读一遍(重新训练),这太费时间了;要么尝试用某种“魔法”把书里的内容从学生脑子里抹去(微调模型),但这往往不彻底,或者会让学生把其他书也记混了。

这篇论文的作者说:“我们为什么不从一开始就设计一种天生就容易遗忘的 AI 呢?”

核心概念:半参数模型(SPM)—— 一个“带参考书”的 AI

作者提出了一种新的 AI 架构,叫做深度半参数模型(SPM)。为了理解它,我们可以用两个比喻:

1. 传统 AI vs. 我们的新 AI

  • 传统 AI(参数模型): 就像一个死记硬背的学生。他把所有知识都压缩进了自己的大脑(模型参数)里。一旦知识被压缩,你就分不清哪句话是哪本书里的了。如果你想让他忘记某本书,你只能让他把大脑清空,重新学习剩下的内容。
  • 我们的新 AI(半参数模型): 就像一个聪明的侦探。他不仅有自己的推理能力(参数部分),还随身带着一本**“参考书”(训练数据集)。当他回答问题时,他会一边用自己的逻辑,一边实时翻阅参考书**,找到相关的案例来辅助判断。

2. “遗忘”是如何发生的?

  • 传统方法: 要忘记某本书,侦探必须把整本参考书重抄一遍,把那本书的内容剔除,然后再重新整理笔记。这很慢。
  • 我们的方法(测试时删除): 当有人要求侦探“忘记”关于“猫”的知识时,侦探不需要重写笔记。他只需要在回答问题时,把参考书里关于“猫”的那几页纸抽走,只看剩下的部分。
    • 因为他的决策是实时参考这些书页的,只要书页没了,他自然就不会再输出关于“猫”的答案了。
    • 这个过程瞬间完成,而且因为他没动过自己的大脑(模型参数),所以其他知识(比如关于“狗”的知识)完全不会受影响。

论文的主要贡献

  1. 设计思路的转变: 以前大家研究的是“怎么给已经学会的 AI 做手术(算法)”来让它遗忘;这篇论文研究的是“怎么设计一个天生就适合遗忘的 AI 架构”。
  2. 性能不打折: 作者担心这种“带参考书”的 AI 会不会变笨?实验证明,在图像分类(认图)和图像生成(画图)任务上,这种新 AI 的表现和传统 AI 一样强,甚至更好。
  3. 速度极快:
    • 传统方法:要“忘记”一张图片,可能需要几小时甚至几天来重新训练。
    • 我们的方法:只需要不到 1 秒。就像从书架上抽走一本书一样快。
    • 在著名的 ImageNet 数据集上,他们的遗忘速度比现有方法快了10 倍以上,而且遗忘后的效果几乎和“重新训练”出来的完美模型一模一样。

生活中的类比

想象你在开一家餐厅

  • 传统 AI 餐厅: 厨师把所有客人的口味偏好都记在脑子里。如果一位客人要求“删除我的订单记录”,厨师很为难。他要么把脑子里所有客人的记忆都清空重记(重新训练),要么试图用橡皮擦擦掉那个人的名字(微调),但这可能会把旁边客人的名字也擦花。
  • SPM 餐厅(本文方案): 厨师手里拿着一本实时更新的菜单本。每道菜怎么做,厨师都参考菜单本上的记录。
    • 如果客人要求“删除我的订单”,厨师不需要换脑子,只需要把菜单本上那一页撕下来,或者把那一页合上。
    • 下次点菜时,厨师自然就不会再按那个客人的口味做菜了。
    • 而且,因为厨师的烹饪技巧(模型参数)没变,其他客人的菜依然做得完美无缺。

总结

这篇论文的核心思想是:与其费力地去“擦除”AI 的记忆,不如设计一种 AI,让它把记忆“外挂”在外部数据上。 当需要遗忘时,直接切断外部连接即可。

这种方法不仅(秒级完成),而且干净(彻底遗忘,不留痕迹),同时还能保证 AI 的智商不下降。这对于保护个人隐私(比如欧盟的 GDPR 法规要求“被遗忘权”)和构建更安全的 AI 系统来说,是一个巨大的进步。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →