PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems

本文介绍了 Pinterest 推出的 PinRec 模型,该模型通过结果条件生成和多 Token 生成技术,在工业级规模下成功实现了推荐系统性能、多样性与效率的平衡,并首次严谨地验证了生成式检索在大规模工业场景中的落地可行性。

Prabhat Agarwal, Anirudhan Badrinath, Laksh Bhasin, Jaewon Yang, Edoardo Botta, Jiajing Xu, Charles Rosenberg

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 PinRec 的新系统,它是 Pinterest(一个全球知名的图片分享和灵感发现平台)用来给用户推荐内容的“超级大脑”。

为了让你更容易理解,我们可以把 Pinterest 想象成一个拥有数亿种商品的巨大图书馆,而 PinRec 就是那个最懂你的图书管理员

以前,这个管理员(旧系统)是这样工作的:

  • 旧方法(双塔模型): 管理员手里有两张卡片,一张写着“你刚才看了什么”,另一张写着“这本书讲了什么”。他快速比对这两张卡片,如果相似度很高,就把书推给你。这就像是在玩“连连看”,虽然快,但有点死板,只能找到“长得像”的东西,很难理解你深层的意图。

PinRec 做了什么改变?
PinRec 不再只是玩“连连看”,它变成了一个会写故事的预言家。它不再只是比对卡片,而是直接**“生成”**出你可能喜欢的下一本书(Pin)。

这篇论文主要解决了三个大难题,我们可以用三个生动的比喻来解释:

1. 目标导向的“点菜”服务 (Outcome-Conditioned Generation)

问题: 以前管理员只能给你推书,但他不知道你是想“快速浏览”(点击),还是想“收藏起来慢慢看”(保存/Repin),或者是想“买下来”(购物)。不同的目标需要不同的推荐策略。
PinRec 的解法:
想象你去餐厅点菜。

  • 如果你说:“我想填饱肚子"(对应“点击”),厨师(PinRec)就会给你上那些分量足、下饭快的菜。
  • 如果你说:“我想发朋友圈炫耀"(对应“保存/Repin"),厨师就会给你上那些摆盘精美、颜值高的菜。
  • 如果你说:“我想买食材回家做"(对应“购物”),厨师就会给你推荐那些食材齐全、有食谱的菜。

PinRec 允许产品经理像点菜一样,告诉系统:“今天我们要多推一些能让人保存的内容”或者“今天我们要多推一些能让人点击的内容”。系统会根据这个指令,动态调整它生成的推荐列表。
效果: 就像厨师完全听懂了你的口味,你想看什么,它就给你推什么,不再是一刀切。

2. 一次生成一串,而不是一个一个 (Multi-Token Generation)

问题: 以前的生成式模型像是一个慢吞吞的打字员。它一次只能打出一个字(一个推荐项),然后停下来思考,再打出下一个字。如果要给你推荐 10 个东西,它就要打 10 次,速度很慢,而且打出来的东西可能都差不多(缺乏多样性)。
PinRec 的解法:
PinRec 变成了一个神笔马良,或者一个能同时画多幅画的画家

  • 它不再一次只画一个苹果,而是一次挥笔,就能同时画出“苹果、香蕉、橘子”这一串水果。
  • 在技术上,这叫“多 Token 生成”。它能在一个步骤里预测出未来好几个时间点你会喜欢的东西。

效果:

  • 速度快了: 就像从“单线程”变成了“多线程”,生成同样数量的推荐,时间大大缩短。
  • 花样多了: 因为它是一次性生成一串,所以这串东西天然就更多样化,不会全是同一种类型的东西,就像一盘水果拼盘比一盘全是苹果要丰富得多。

3. 超级高效的“图书馆” (Efficient Serving)

问题: 这种“会写故事、能一次画多幅画”的超级管理员,通常非常烧钱、非常慢,根本没法服务 Pinterest 上 5 亿多用户。
PinRec 的解法:
Pinterest 的工程师们给这个超级管理员配备了一套顶级的流水线工具(基于 NVIDIA Triton 和 GPU 优化)。

  • 他们把复杂的计算过程像流水线一样优化,让管理员在几毫秒内就能完成“思考”和“生成”。
  • 他们还发明了一种“压缩”技巧:如果生成的几个推荐太像了,就自动把它们合并,避免重复劳动。

效果: 这个系统现在可以像闪电一样,同时服务数亿用户,而且成本可控。

总结:PinRec 带来了什么?

如果把 Pinterest 比作一个巨大的灵感集市

  • 以前: 集市管理员只会机械地把“看起来像”的摊位推给你,不管你是想买东西还是想拍照。
  • 现在 (PinRec): 管理员不仅能听懂你的潜台词(是想买、想存还是想点),还能一次性给你变出一整桌丰富多样、符合你当下心情的美食。

实际成果:
在 Pinterest 的真人测试中,这个新系统让:

  • 全站点击量增加了 2%
  • 搜索后的“保存”(Repin)量增加了 4%
  • 用户花在网站上的时间也变多了。

简单来说,PinRec 让推荐系统从“只会猜”变成了“懂你且高效”,既满足了用户的探索欲,也帮 Pinterest 实现了商业目标。这是生成式 AI 在超大规模工业界应用的一个里程碑。