SOLAR: SVD-Optimized Lifelong Attention for Recommendation

本文提出了名为 SOLAR 的推荐序列建模框架,通过引入理论上无损且保留 Softmax 机制的 SVD-Attention 技术,将注意力复杂度从O(N2d)O(N^2 d)降低至O(Ndr)O(Ndr),从而实现了在无需过滤的情况下对万级行为序列和千级候选集的高效建模,并在快手线上场景中显著提升了视频观看量等核心业务指标。

Chenghao Zhang, Chao Feng, Yuanhao Pu, Xunyong Yang, Wenhui Yu, Xiang Li, Yongqi Liu, Lantao Hu, Kaiqiao Zhan, Han Li, Kun Gai

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 SOLAR 的新系统,它是为了解决推荐系统(比如快手、抖音)中一个非常头疼的问题:如何既看得多,又看得快,还能看得准。

为了让你轻松理解,我们可以把推荐系统想象成一个超级繁忙的图书管理员,而用户的历史行为就是书架上堆积如山的书

1. 核心痛点:管理员的“记性”与“速度”的矛盾

  • 传统方法(Attention 机制):
    想象一下,图书管理员要给你推荐书。他手里有一本“用户历史清单”(比如你过去看了 10,000 本书),面前还有 3,000 本“候选新书”要选。
    传统的做法是:管理员要把每一本候选新书,和每一本历史清单里的书都进行“比对”,看看它们有没有关系。

    • 比喻: 就像你要在 3,000 个候选人里选一个,然后让这 3,000 个人每个人都去和 10,000 个老朋友握手、聊天、确认关系。
    • 后果: 握手次数是 $3,000 \times 10,000 = 3,000,000$ 次!这太慢了,电脑算不过来。所以以前的系统只能“偷懒”,只挑最近看的 50 本书,或者用一些笨办法过滤掉大部分书,但这会漏掉很多重要信息(比如你很久以前看过但很喜欢的书)。
  • 现有的“快”方法(Linear Attention):
    为了解决慢的问题,有人发明了一种“快速通道”。

    • 比喻: 管理员不再一个个握手,而是把所有人的手都叠在一起,快速算个总数。
    • 后果: 速度是快了,但是味道变了。这种“快速通道”把原本精细的“谁更重要”的权重给弄丢了,就像把一杯浓茶和一杯白开水混在一起,最后大家都觉得味道平平,推荐就不准了。

2. SOLAR 的绝招:SVD-Attention(给书架“瘦身”)

这篇论文发现了一个秘密:用户的历史行为虽然看起来有 10,000 条,但核心信息其实很少,大部分是重复的。

  • 比喻(低秩结构):
    想象你的书架上有 10,000 本书。虽然书很多,但你可能只喜欢“科幻”、“历史”和“美食”这三类。其他的书其实都是这三类的变种。
    这就好比这 10,000 本书其实可以压缩成3 个核心主题

  • SVD-Attention 的做法:
    SOLAR 系统利用数学上的“奇异值分解”(SVD),相当于给这 10,000 本书做了一个智能压缩

    • 它把 10,000 本书压缩成了几个“核心主题包”(比如 30 个包)。
    • 管理员现在只需要拿 3,000 本新书去和这30 个核心包比对,而不是和 10,000 本书比对。
    • 关键点: 它既保留了传统方法那种“精细比对”的准确度(没有丢掉 Softmax 机制),又把计算量从“天文数字”降到了“ manageable"(可管理)的水平。

3. SOLAR 的两大优势

A. 看得更全(Lifelong Attention)

以前的系统只能记住你最近 50 次点击。SOLAR 可以记住你过去 10,000 次甚至更多的点击,而且不需要过滤。

  • 比喻: 以前的管理员只记得你上周买了什么;SOLAR 记得你这辈子买过什么,并且能瞬间从这辈子的记忆里找到和你现在需求最匹配的东西。

B. 看得更准(Set-wise Modeling)

以前的系统是一个个单独打分(点评分),觉得这本书好就推,不管旁边有没有更好的。
SOLAR 是把候选书放在一起看(集合评分)。

  • 比喻: 以前是“这个苹果不错,给你”;现在是“这一篮苹果里,哪个最红、最甜、最适合你现在的口味?”。它知道如果篮子里有一个超级完美的苹果,那个普通的苹果就不该被选中。这更符合真实世界的选择逻辑。

4. 实际效果:快手真的用上了

这篇论文的作者来自快手(Kuaishou)。他们在快手的真实环境中测试了 SOLAR:

  • 数据量: 处理了 12,000 条用户历史行为和 3,000 个候选视频。
  • 结果: 视频观看量提升了 0.68%
    • 注:在工业界,0.1% 的提升就已经非常惊人了,0.68% 是巨大的成功。
  • 成本: 虽然算得更多了(因为看了更多历史),但因为用了“瘦身”技术,反而节省了机器资源(少用了 50% 以上的 CPU 核心)。

总结

SOLAR 就像是一个拥有“超级记忆”且“极其聪明”的图书管理员。

它不再笨拙地翻遍所有书,也不再用粗糙的方法快速扫视。它学会了提炼精华(SVD),把海量的历史记忆压缩成几个核心概念,既能瞬间从一万条历史记录中找到灵感,又能在一堆候选者中做出最完美的组合选择

这不仅让推荐更准、更懂你,还让系统跑得更快、更省钱。这就是为什么它能成为工业界推荐系统的一次重大升级。