Unbiased Rectification for Sequential Recommender Systems Under Fake Orders

本文针对虚假订单对序列推荐系统的威胁,提出了一种名为 DITaR 的双视图识别与定向修正方法,该方法通过协同与语义双视图精准识别有害样本,利用梯度上升进行针对性修正,在无需重新训练模型的前提下实现了高效、无偏的系统修复,同时保留了虚假订单中可能有益的数据增强信息。

Qiyu Qin, Yichen Li, Haozhao Wang, Cheng Wang, Rui Zhang, Ruixuan Li

发布于 2026-04-13
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于**“如何给被捣乱的推荐系统‘排毒’,而不伤及无辜”**的故事。

想象一下,你正在经营一家非常受欢迎的**“智能书店”(这就是序列推荐系统**)。这家书店很聪明,它会根据你过去读过的书,推测你下一本想看什么。

1. 问题:书店里混进了“捣蛋鬼”

最近,书店里出现了一些**“假订单”**(Fake Orders)。

  • 什么是假订单? 这不是指有人故意注册假账号(那是老套路了),而是指有人把假的买书记录偷偷塞进了真实顾客的阅读历史里。
  • 捣蛋鬼的套路:
    • 刷单(Click Farming): 比如你刚看了《哈利波特》,捣蛋鬼就在你后面硬塞了 10 本《母猪的产后护理》,想强行把你带偏。
    • 乱点鸳鸯(Context-irrelevant): 你刚看完科幻片,它硬塞给你一本菜谱,完全不合逻辑。
    • 时间错乱(Sequential Perturbations): 把你昨天看的书和上个月看的书顺序颠倒,让书店以为你的口味突然变了。
  • 后果: 书店变得“精神分裂”,开始给你推奇怪的东西,你越看越不爽,甚至不再信任这家书店了。

2. 传统做法的尴尬:要么“大扫除”,要么“瞎猜”

以前,如果书店发现数据乱了,通常只有两种笨办法:

  1. 推倒重来(Retrain): 把整个书店关门,把所有书(数据)清空,重新装修、重新培训员工。这太费钱、太费时间了,而且可能会把一些原本有用的信息也扔了。
  2. 简单删除(Delete): 看到可疑的订单就删掉。但这有个大问题:有些“假订单”其实是有用的! 比如,有时候把两本书顺序互换一下,反而能帮书店发现新的规律(这叫数据增强)。如果一刀切全删了,书店就变笨了。

3. 本文的妙招:DITaR(双重视眼 + 精准排毒)

这篇论文提出了一种叫 DITaR 的新方法,它像是一个**“高明的侦探 + 外科医生”**的组合。

第一步:侦探的“双重视眼”(Dual-view Identification)

这个侦探有两只眼睛,分别看不同的东西:

  • 左眼(协作视角): 看大家**“通常怎么买”**。比如,买尿布的人通常也会买啤酒。如果有人在买尿布后突然买了一辆坦克,这只眼睛就会报警:“不对劲!”
  • 右眼(语义视角): 看**“东西本身像不像”**。比如,刚看完《三体》,下一本应该是《流浪地球》。如果下一本是《如何养仓鼠》,这只眼睛也会报警:“逻辑不通!”

核心逻辑: 真正的顾客,这两只眼睛看到的是一致的;而捣蛋鬼制造的假订单,往往**“顾头不顾尾”**,两只眼睛看到的画面是冲突的。侦探通过对比这两只眼睛看到的差异,就能精准地揪出哪些是可疑的假订单。

第二步:外科医生的“精准手术”(Targeted Rectification)

揪出可疑订单后,千万别急着全删掉! 这时候需要“外科医生”出场了。

  • 影响函数(Influence Function): 医生会做一个“思想实验”:“如果我把这个订单删掉,书店的推荐能力是变好了,还是变差了?”
    • 如果删掉后,推荐变差了(说明这个假订单其实帮了忙,或者它是无害的),那就留着它!
    • 如果删掉后,推荐变好了(说明它确实是毒药),那就动手!
  • 梯度上升(Gradient Ascent): 医生不是粗暴地切除,而是用一种非常精细的“微调”技术,只把那些真正有害的“毒素”中和掉,同时尽量保留书店的原有结构。

4. 最终效果

经过这套操作:

  • 不用关门重装: 书店不需要停业重新装修(不用重新训练整个模型)。
  • 不伤及无辜: 那些虽然看起来奇怪但实际有用的“假数据”被保留了下来,甚至变成了书店的营养。
  • 恢复信任: 书店的推荐又变得准确了,顾客重新满意了。

总结

这就好比给一个生病的人治病:

  • 旧方法是:要么把病人扔进 ICU 从头养(太慢),要么把身上所有长痘的地方都切掉(太狠,可能切错)。
  • DITaR 方法是:先用双筒望远镜(双视角)精准定位哪些是坏痘,再用显微镜(影响函数)确认哪些必须治,最后用激光手术(梯度微调)只把坏痘点掉,让病人(推荐系统)快速恢复健康,而且比以前更强壮。

这篇论文的核心贡献就是:在推荐系统被“假订单”污染时,提供了一种既快、又准、又不伤及无辜的“排毒”方案。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →