U-CAN: Utility-Aware Contrastive Attenuation for Efficient Unlearning in Generative Recommendation

本文提出了 U-CAN 框架,通过利用低秩适配器上的效用感知对比衰减机制,在解决生成式推荐中敏感信息遗忘与模型效用保留之间矛盾的同时,实现了高效且精准的机器遗忘。

Zezheng Wu, Rui Wang, Xinghe Cheng, Yang Shao, Qing Yang, Jiapu Wang, Jingwei Zhang

发布于 2026-03-02
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 U-CAN 的新方法,专门用来解决生成式推荐系统(比如抖音、淘宝的“猜你喜欢”)中的一个棘手问题:如何在保护用户隐私的同时,不让推荐系统变笨?

为了让你轻松理解,我们可以把整个故事想象成**“一位才华横溢但记性太好的厨师”**。

1. 背景:记性太好是个麻烦

想象一下,你开了一家餐厅,请了一位超级厨师(这就是生成式推荐模型,基于大语言模型)。

  • 优点:他非常聪明,能根据客人的喜好做出完美的菜(推荐)。
  • 缺点:他的记性太好了。如果客人 A 曾经偷偷告诉他:“我讨厌吃香菜,而且我有个秘密是我不喜欢红色盘子。”这位厨师不仅记住了,甚至把这些信息“刻”在了他的脑子里(模型参数中)。
  • 问题:现在客人 A 要求:“请忘掉我刚才说的话,忘掉我对香菜的厌恶,也忘掉我的秘密。”(这就是机器遗忘/Unlearning)。

2. 传统方法的困境:要么“伤筋动骨”,要么“忘不干净”

以前的厨师(传统遗忘方法)处理这种要求时,通常只有两种笨办法:

  • 方法 A:暴力重练(Gradient Ascent)
    • 做法:厨师试图强行把脑子里关于“香菜”的记忆擦掉。
    • 后果:因为记忆是交织在一起的,他用力过猛,结果把“香菜”和“做菜的通用技巧”一起擦掉了。现在他连怎么切菜都忘了,做出来的菜很难吃(效用损失,即推荐质量下降)。
  • 方法 B:粗暴剪枝(Pruning)
    • 做法:厨师直接拿剪刀,把脑子里所有跟“香菜”有关的神经元剪断。
    • 后果:虽然“香菜”没了,但他发现很多重要的神经连接也被剪断了。比如,负责“判断口味”的神经和负责“香菜”的神经是连在一起的,剪掉前者,后者也废了。餐厅的结构被破坏了,厨师变得结结巴巴(结构损伤)。

核心难题(多义词困境): 在厨师的大脑里,关于“客人 A 的秘密”和“通用的烹饪知识”是混在一起的,就像把红墨水滴进了白颜料里,很难只把红色挑出来而不弄脏白色。

3. U-CAN 的妙计:精准“调音”而非“切除”

U-CAN 就像一位高明的调音师,它不剪断神经,也不暴力重练,而是做三件事:

第一步:对比找茬(Contrastive Activation)

  • 比喻:调音师让厨师分别做两道菜:一道是给“客人 A"做的(包含敏感信息),一道是给“普通客人”做的(通用信息)。
  • 操作:调音师仔细观察厨师在做这两道菜时,大脑里哪些部位特别活跃。
    • 如果某个部位在做“客人 A 的菜”时疯狂跳动,但在做“普通菜”时很平静,那这个部位就是**“高风险区”**(专门记了秘密)。
    • 如果某个部位做两道菜时都很活跃,那它是**“安全区”**(通用知识)。

第二步:价值评估(Utility Significance)

  • 比喻:调音师还要看这个部位对厨师的整体水平有多重要。
  • 操作:有些部位虽然对“客人 A"很敏感,但它也是厨师做“招牌菜”的关键。如果把它调低太多,招牌菜就毁了。所以,U-CAN 会计算一个**“重要性分数”**,确保那些对通用推荐至关重要的部分得到保护。

第三步:温柔降噪(Adaptive Soft Attenuation)

  • 比喻:这是 U-CAN 最厉害的地方。它不是把“敏感部位”直接关掉(像关灯一样,0 或 1),而是像调音台上的推子一样,慢慢把音量调小
  • 操作
    • 对于只记了秘密、对做菜没用的部位:音量调得很低(几乎听不见)。
    • 对于既记了秘密、又对做菜很重要的部位:音量稍微调低一点点,既削弱了秘密的影响,又保留了做菜的能力。
    • 结果:厨师依然能完美地给其他客人做菜,但再也不会主动提起或联想到“客人 A"的秘密了。

4. 实验结果:既安全又美味

论文在两个真实数据集(像电影推荐和超市购物推荐)上测试了 U-CAN:

  • 隐私保护:客人 A 的秘密被彻底“遗忘”了,模型再也猜不到他的喜好。
  • 推荐质量:给其他客人推荐菜时,依然非常精准,没有变笨。
  • 效率:不需要把厨师重新培训一遍(不需要重练模型),只需要几分钟的“调音”就能完成,非常快。

总结

U-CAN 就像给推荐系统装了一个**“智能橡皮擦”
以前的橡皮擦要么擦不干净(隐私泄露),要么把整张纸都擦破了(推荐变差)。
U-CAN 的橡皮擦非常精准,它只擦掉那些
“只属于特定用户且对整体功能影响不大”的笔迹,同时小心翼翼地保护着那些“大家共用的、对推荐至关重要的”**知识。

这样,我们既能尊重用户的“被遗忘权”,又能继续享受聪明、好用的推荐服务。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →