Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

本文针对大语言模型推荐系统在持续学习中的挑战,提出了一种名为 PESO 的新方法,该方法通过引入将当前适配器锚定在最近冻结状态的近端正则化器,有效平衡了模型对新用户行为的适应与对旧知识的保留,从而在持续学习场景下显著优于现有基于 LoRA 的方法。

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang Tong

发布于 Tue, 10 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文主要解决了一个非常有趣的问题:如何让一个“超级推荐员”(基于大语言模型的推荐系统)在不断学习新东西的同时,不忘记老用户喜欢的东西,也不被过时的喜好带偏?

为了让你更容易理解,我们可以把这个过程想象成一位老练的图书管理员(推荐系统)在管理一家不断变化的书店

1. 背景:书店里的挑战

想象一下,你是一位图书管理员。

  • 过去:你根据老顾客的历史记录,知道他们喜欢“科幻小说”。
  • 现在:时间流逝,顾客的兴趣变了。有的老顾客突然开始迷上“浪漫小说”;有的新顾客只喜欢“悬疑剧”。
  • 难题:如果你完全按照顾客最近的喜好来推荐,你可能会忘记他们长期的爱好(比如那个突然迷上浪漫小说的人,其实骨子里还是科幻迷,只是最近被新书吸引了)。如果你死守着过去的喜好,又无法推荐出他们现在真正想看的书。

在传统的推荐系统里,这就像是一个“遗忘”和“僵化”的拉锯战。

2. 现有的两种“笨办法”

论文里提到,之前大家尝试过两种主要方法,但都有缺陷:

  • 方法 A:完全重写(Single Evolving LoRA)
    • 比喻:管理员每次看到新顾客,就把脑子里的旧规则全擦掉,只记现在的。
    • 结果:反应很快,能跟上潮流,但容易健忘。那个喜欢科幻的老顾客,因为最近看了几本浪漫小说,管理员就彻底忘了他爱科幻,以后只推浪漫书给他,这就错了。
  • 方法 B:层层叠加(Cumulative LoRA)
    • 比喻:管理员每遇到一个新阶段,就保留一本旧的“喜好笔记”,然后加上一本新的。推荐时,把过去所有的笔记都拿出来一起看。
    • 结果:虽然记住了过去,但太死板了。笔记越积越厚,而且旧的笔记(比如顾客五年前喜欢的书)可能会干扰现在的判断。就像你明明现在想吃火锅,但脑子里还塞着五年前减肥时的沙拉食谱,导致你点菜时犹豫不决,甚至点错了。

3. 论文的新方案:PESO(带“锚点”的灵活管理员)

作者提出了一种叫 PESO 的新方法。它的核心思想是:只保留一本“活”的笔记,但这本笔记要有一个“锚点”。

  • 核心比喻:橡皮筋与锚点
    想象管理员手里有一本正在写的笔记(当前的模型),这本笔记通过一根有弹性的橡皮筋,系在上一本写好的笔记(过去的状态) 上。

    • 当新数据(新喜好)很强时:比如顾客最近疯狂看悬疑小说,橡皮筋会被拉得很长,笔记会大幅度更新,迅速适应新喜好(可塑性)。
    • 当新数据很弱时:比如顾客只是偶尔翻了一下悬疑书,橡皮筋的拉力会把笔记拉回原来的位置,防止它乱跑,从而保留长期的喜好(稳定性)。
  • PESO 的聪明之处
    它不是简单地“记住”或“忘记”,而是通过一种数学上的“近邻约束”(Proximal Regularizer),让模型自己决定:

    • 哪些新变化是真的重要,值得大改?(橡皮筋拉断,去适应新趋势)
    • 哪些变化只是噪音,应该保持原样?(橡皮筋拉回,保持老习惯)

    而且,它不像“层层叠加”法那样把旧笔记全堆在一起,而是只保留最新的一版旧笔记作为锚点。这样既省空间,又不会让过时的信息干扰现在的判断。

4. 为什么这很重要?

在现实生活中,人的兴趣是流动的。

  • 以前的方法:要么太容易变心(忘了老用户),要么太固执(推不出新东西)。
  • PESO 方法:像是一个懂分寸的老朋友。他知道你最近迷上了摇滚乐,会给你推摇滚;但他也知道你骨子里还是喜欢爵士,不会因为你最近听了一首摇滚就彻底把你归类为摇滚迷。

5. 实验结果

作者在亚马逊(Amazon)的真实数据上做了测试(乐器、电影、书籍三个领域)。

  • 结果:PESO 比之前的所有方法都更准。
  • 表现:它既能抓住新出现的流行趋势(比如突然火起来的某类书),又能稳稳地守住用户长期的核心兴趣。

总结

这篇论文就像是在教我们的 AI 推荐系统如何优雅地变老
它不再是一个只会死记硬背的机器,也不再是一个朝三暮四的墙头草。它学会了在“改变”与“坚守”之间找到完美的平衡点,就像一位经验丰富的图书管理员,既能跟上时代的潮流,又能读懂你内心深处不变的喜好。

一句话概括:PESO 给 AI 推荐系统装上了一根“智能橡皮筋”,让它既能灵活地适应新潮流,又不会在追逐潮流时弄丢了自己的初心。