Unified Learning-to-Rank for Multi-Channel Retrieval in Large-Scale E-Commerce Search

该论文提出了一种面向大规模电商搜索的统一排序模型,通过将多通道检索融合重构为查询感知的学习排序任务,有效解决了传统方法无法处理通道间交互和查询特异性权重的难题,在满足低延迟生产要求的同时显著提升了用户转化率。

Aditya Gaydhani, Guangyue Xu, Dhanush Kamath, Ankit Singh, Alex Li

发布于 Mon, 09 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲的是 Target(美国一家大型零售巨头)是如何改进他们的电商搜索系统的。

想象一下,你走进 Target 的线上商店,在搜索框里输入“夏天野餐篮”。你的目标是找到最合适的商品,但背后的系统面临着巨大的挑战:它不仅要找到你真正想要的东西,还要兼顾卖得好的、刚上架的新品、季节性商品等等。

这篇论文就是讲述他们如何把原本各自为战的“找货小分队”,整合成一个超级智能的“选品大师”

以下是用通俗易懂的比喻和语言对这篇论文的解读:

1. 背景:混乱的“寻宝游戏”

在大型电商网站里,商品库就像一片巨大的海洋。为了帮你找到东西,系统不能只派一个“侦探”去搜索,因为不同的侦探擅长不同的事:

  • 侦探 A(关键词专家):擅长找字面意思完全匹配的词。
  • 侦探 B(语义专家):擅长理解“野餐篮”可能包含“露营装备”。
  • 侦探 C(潮流专家):专门找最近刚火起来的新品。
  • 侦探 D(销量专家):专门找大家都买过的爆款。

以前的问题:
以前,系统把这些侦探找到的结果拼在一起时,用的是**“死板的规则”。比如:“不管搜什么,侦探 A 的结果永远排前面,侦探 C 的结果永远排后面”。
这就像是一个
只会按固定名单发号施令的排长**。如果今天大家都在找“新出的网红款”,但排长死板地只推“老爆款”,用户就会失望,买不到想要的东西。

2. 核心创新:从“死板规则”到“智能大脑”

作者提出了一种**“统一学习排序”(Unified Learning-to-Rank)**的方法。

比喻:从“排长”变成“经验丰富的老练店长”
新的系统不再死板地给每个侦探分配固定的权重。相反,它训练了一个超级大脑(机器学习模型)

  • 看情况办事(查询感知):当你搜“野餐篮”时,大脑会想:“哦,现在是夏天,大家可能更想要‘潮流专家’找的新款,而不是‘销量专家’找的老款。”于是它动态调整,把新品的排名提上去。
  • 跨部门协作(交叉互动):大脑会观察侦探们找到的结果是否有重叠或互补,而不是把它们当成互不相干的列表。

3. 关键技巧:如何教大脑“变聪明”?

为了让这个大脑学会什么才是“好结果”,作者用了三个关键招数:

A. 时间胶囊(时间感知)

  • 做法:他们不是看过去十年的数据,而是把数据按**“周”**来切分。
  • 比喻:就像你判断一个人是否流行,不能只看他十年前的照片,要看他上周在穿什么。这样模型就能捕捉到“突然爆火”的趋势,而不是只推荐那些永远卖得好的老古董。

B. 黄金标准(标签构建)

  • 做法:他们定义了一个复杂的“得分公式”来给商品打分。
  • 比喻:以前可能只看“有没有人点过”(点击)。现在,他们把用户的整个购物旅程都算进去了:
    • 看一眼(印象)= 1 分
    • 点进去(点击)= 5 分
    • 加入购物车 = 10 分
    • 直接付款(购买)= 100 分
    • 这个公式告诉模型:“别光盯着点击率,我要的是最后能卖出东西的商品!”

C. 记忆与直觉(用户行为特征)

  • 做法:模型会记住用户最近的行为。
  • 比喻:如果你刚才在搜“婴儿车”,模型会立刻意识到你可能在准备当父母,这时候它就不会给你推“啤酒”了,而是推“尿布”或“奶瓶”。它利用了用户短期的意图变化来调整推荐。

4. 结果:真的有用吗?

作者把新系统(超级大脑)和旧系统(死板排长)在 Target 的网站上进行了A/B 测试(就像让两拨人同时开店,看谁生意好)。

  • 速度:新系统非常快,处理一次搜索只需要不到 50 毫秒(眨眼间),完全不影响用户体验。
  • 效果
    • 用户下单购买的比例提升了 2.85%
    • 把商品加入购物车的比例提升了 2.81%
    • 点击率也提升了。

简单说:因为系统更懂用户当下想要什么,所以卖出去的货更多了。

5. 总结

这篇论文的核心思想就是:在电商搜索中,不要试图用一套固定的规则去管理所有情况。

通过训练一个**“全能型大脑”,让它学会根据具体的搜索词**、当前的时间趋势以及用户的真实购买意愿,动态地把不同渠道找来的商品进行最完美的排列组合。这不仅让用户体验更好(更容易找到想要的),也让商家赚得更多(转化率更高)。

这就好比从**“按名单发号施令”进化到了“见人说人话,见鬼说鬼话,见客推好货”**的顶级销售境界。