Trinity: A Scenario-Aware Recommendation Framework for Large-Scale Cold-Start Users

本文提出了名为 Trinity 的框架,通过协同整合特征工程、模型架构与稳定更新机制,有效解决了微软十亿级用户产品迁移中大规模新用户在新场景下面临的冷启动挑战。

Wenhao Zheng, Wang Lu, Fangshuang Tang, Yiyang Lu, Jun Yang, Pengcheng Xiong, Yulan Yan

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于**“如何在新环境中快速让推荐系统‘懂’新用户”**的故事。

想象一下,你经营着一家非常成功的老式书店(这就是微软 MSN 的“经典版”页面)。这里有很多老顾客,他们喜欢什么书、看了多久、买了什么,你都记得清清楚楚。你的推荐系统就像一位经验丰富的老店员,能精准地给老顾客推荐他们喜欢的书。

但是,突然有一天,你决定把书店彻底改造,开一家充满未来感的“人工智能体验店”(这就是新的"Copilot 风格”页面)。

  • 新挑战:这里来的大部分是从未进过店的新顾客(冷启动用户),而且店里的布局、展示的商品(比如 AI 生成的内容卡片)都和以前完全不同。
  • 老店员的困境:如果让那位“老店员”直接来新店里工作,他会很迷茫。因为他只记得老顾客在旧书店的习惯,面对新顾客和新商品,他要么乱猜,要么完全不敢推荐,导致新顾客体验很差,甚至直接离开。

这篇论文提出的 Trinity(三位一体) 框架,就是为了解决这个难题,它像是一个**“超级培训方案”**,包含三个核心步骤:

1. 特征工程:从“只记目标”到“全貌观察”

  • 传统做法:老店员只盯着顾客手里正在看的那本书(目标商品)去回忆。如果新顾客手里拿的是以前没见过的书,老店员就彻底懵了。
  • Trinity 的做法:我们教老店员**“扩大视野”。不管新顾客手里拿的是什么,我们让他去观察这个人在所有场景**下的行为。
    • 比喻:就像你认识一个新朋友,不能只问他“你喜欢吃什么菜”,而是要看他在过去 1 小时、1 天、1 周、1 个月里,在经典书店新体验店里,对新闻、天气、视频、AI 内容等各种东西的反应。
    • 效果:即使新顾客没看过特定的书,只要他看过类似的新闻或视频,老店员就能通过这些“侧面线索”猜出他的喜好。

2. 模型架构:给推荐系统装上“场景滤镜”和“校准器”

  • 传统做法:新数据太少,老数据太多。模型容易“偏科”,总是用老书店的经验来套新书店,导致推荐的东西不伦不类。
  • Trinity 的做法
    • 场景知识提取器(滤镜):它像一个智能过滤器,能把杂乱的数据整理好,专门提取出“新场景”特有的信号,不让旧数据的声音盖过新数据。
    • 用户画像适配器(校准器):它像一个翻译官。因为新旧场景的点击习惯不一样(比如在新店里,大家更容易点击 AI 生成的内容),这个模块会不断调整预测值,确保系统说“这个人有 80% 概率喜欢”,那实际上真的有 80% 概率喜欢,不会瞎猜。
    • 比喻:这就好比给老店员戴上了一副**“新场景眼镜”,让他能看清新环境的特殊规则,同时给他配了一个“导航仪”**,防止他在新地图里迷路。

3. 模型更新:拒绝“盲目狂奔”,学会“稳健行走”

  • 传统做法:每天更新一次模型。但在冷启动阶段,新用户的行为像过山车一样忽高忽低。如果每天盲目更新,模型今天觉得“大家都喜欢 A",明天觉得“大家都喜欢 B",结果在现实中表现极不稳定,甚至越改越差。
  • Trinity 的做法:采用**“稳定性感知更新”**。
    • 比喻:这就像教一个学步的婴儿走路。如果婴儿今天摔了一跤(数据波动大),我们不会强迫他明天必须跑得更快。我们会先看看:这次尝试是让他走得更稳了(AUC 提升),还是让他更晕了(COPC 偏差变大)?
    • 规则:只有当新的模型既更准(AUC 提高)又更稳(预测和实际点击率偏差在允许范围内)时,我们才把它上线。否则,就保留旧的、稳定的版本。
    • 效果:防止模型因为新用户的“情绪波动”而发疯,确保它始终稳健地服务用户。

总结与成果

微软将这套 Trinity 框架应用到了拥有10 亿用户的 MSN 产品迁移中(从经典版搬到 Copilot 版)。

  • 结果
    • 离线实验:在新场景下,推荐准确率(AUC)从接近乱猜的 0.5 提升到了 0.7 以上,预测的点击率也变得更准了。
    • 在线测试:真实用户的使用时间增加了 5.61%,活跃用户数增加了 3.04%。这是过去半年里该类产品最大的进步!
    • 成本:只增加了极少的计算时间(约 10 毫秒),几乎可以忽略不计。

一句话总结
Trinity 就像一位聪明的导师,它教会了推荐系统如何在新环境中,通过观察全局线索佩戴场景眼镜、以及稳健地学习,迅速从一个“迷茫的新手”变成“懂你的老专家”,让亿万新用户也能立刻享受到精准的推荐服务。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →