T-REX: Transformer-Based Category Sequence Generation for Grocery Basket Recommendation

本文针对在线杂货购物中重复购买模式与复杂商品关系的挑战,提出了一种名为 T-REX 的基于 Transformer 的架构,通过动态序列采样、自适应位置编码及类别级建模等创新,有效捕捉短期篮内依赖与长期用户偏好,从而在亚马逊在线杂货业务中显著提升了个性化品类推荐及下一篮预测的准确性。

Soroush Mokhtari, Muhammad Tayyab Asif, Sergiy Zubatiy

发布于 Tue, 10 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 T-REX 的聪明系统,它是亚马逊专门为在线杂货购物(比如买牛奶、面包、蔬菜)设计的一个“超级购物助手”。

为了让你轻松理解,我们可以把这次购物经历想象成去一家巨大的超市买菜,而 T-REX 就是那个最懂你口味的老练导购员

1. 为什么要发明 T-REX?(痛点)

普通的网购(比如买衣服、买家具)通常是一次性的,你买了一件衬衫,下次可能买裤子,没什么规律。

买杂货不一样:

  • 重复性:你每周都要买牛奶、鸡蛋、面包。
  • 关联性:买了意面,通常也会买番茄酱;买了啤酒,可能还需要花生米。
  • 时间性:有些东西是周末才买,有些是周一才买。

以前的推荐系统(就像那些只会数数的笨导购)主要看“你过去最常买什么”,然后一直给你推那个。但这不够聪明,因为它不懂你这次具体想怎么搭配,也不懂时间带来的变化。

2. T-REX 是怎么工作的?(核心魔法)

T-REX 是一个基于Transformer(一种很厉害的 AI 架构,就像大语言模型背后的技术)的系统。它有三个独门绝技:

🛒 绝技一:把“具体商品”变成“大类目”(化繁为简)

想象一下,超市里有 29,000 种具体的商品(比如“全脂牛奶 1 升装”、“脱脂牛奶 500 毫升”、“杏仁奶”……)。如果让 AI 直接记这 29,000 种,它的大脑会爆炸,而且很难找到规律。

T-REX 很聪明,它把商品归类了。它不看具体的“全脂牛奶”,而是看"乳制品"这个大类。

  • 比喻:就像你整理衣柜,不是把每一件衬衫都单独记在脑子里,而是把它们都归进“衬衫”这个抽屉里。这样,AI 只需要记住 35 个(后来扩展到 280 个)“抽屉”,就能轻松掌握你的购物习惯。

⏳ 绝技二:动态的“时间切片”(灵活教学)

以前的 AI 训练像死记硬背,把整个购物历史从头背到尾。但 T-REX 采用了动态序列分割

  • 比喻:想象你在教一个学生(AI)如何买菜。
    • 旧方法:让学生把过去 5 年的购物小票全部背下来,然后猜下一张。
    • T-REX 方法:老师随机指小票上的某一天(比如上周三),说:“好,现在假设今天是周三,你之前买了什么?接下来你会买什么?”
    • 这样,AI 就能学会在不同时间点(比如周一和周五)该买什么,而不是死记硬背。这让它在面对新顾客或新情况时,反应更快、更灵活。

🧭 绝技三:特殊的“时间罗盘”(适应不规则的时间)

买衣服可能每天一次,但买菜可能一周一次,甚至两周一次。时间间隔很不均匀。

  • 比喻:普通的地图(位置编码)假设你每天走一步。但买菜的人可能今天走一步,明天停三天。T-REX 发明了一个自适应罗盘,它能理解:“哦,虽然距离上次购物过了 10 天,但这在买菜习惯里是很正常的。”它能精准捕捉这种忽快忽慢的节奏。

3. 它是怎么“猜”你下一篮买什么的?(架构设计)

T-REX 不像以前的模型(像 BERT)那样“左右互搏”(既看前面也看后面来猜中间)。在购物时,你只能根据过去的东西来预测未来

  • 编码器(Encoder):像一个博学的图书管理员。它阅读了全公司所有顾客的购物历史,学会了大家普遍的规律(比如:买尿布的人通常也会买湿巾)。
  • 解码器(Decoder):像一个贴心的私人管家。它看着图书管理员总结的规律,再结合你个人的购物清单,然后只根据你过去买过的东西,一步步猜出你接下来最可能买什么。

这种“先学大众规律,再结合个人习惯”的方式,让它既能懂你,又能利用大家的智慧。

4. 效果怎么样?(实战成绩)

亚马逊在真实的网站上进行了A/B 测试(把用户分成两组,一组看旧系统,一组看 T-REX):

  • 更懂你:T-REX 推荐的物品,用户点击和购买的比例更高。
  • 更准:它不仅能猜出你要买什么,还能猜出顺序。比如,它知道你应该先看到“牛奶”,再看到“麦片”,这符合你逛超市的逻辑。
  • 更赚钱:使用 T-REX 后,相关商品的销售额提升了约 23%,这比一般的推荐系统效果要好得多。
  • 对新客友好:对于购物记录很少的新用户,T-REX 表现尤其出色,因为它能利用“大众规律”来弥补个人数据的不足。

总结

T-REX 就像是一个既懂大数据、又懂你个人习惯的超级购物管家

它不再死板地数数“你以前买过多少次牛奶”,而是通过理解时间节奏商品类别购物场景,像真人一样思考:“哦,这位顾客通常周五晚上会买意面和酱料,而且今天离上次买酱料已经两周了,所以我应该把酱料放在推荐列表的最前面。”

这就是为什么它能帮亚马逊卖出更多东西,同时也让顾客买得更顺心、更省心的原因。