“Context-based Fast Recommendation Strategy for Long User Behavior Sequence in Meituan Waimai” 由 Zhichao Feng、JunJie Xie 等人撰写。在美团外卖推荐系统中,用户行为序列不断增长,现有模型难以有效捕捉长期依赖或存在高复杂度问题。本文提出 Context-based Fast Recommendation Strategy(CoFARS),通过识别与目标上下文相似的上下文来选择相关子序列,利用 Jensen–Shannon 散度衡量相似性,采用基于原型的方法降低复杂度,并构建时间图整合时间信息。实验表明,该策略自 2023 年应用以来,使 CTR 提高 4.6%,GMV 提升 4.2%,在离线和在线实验中均优于对比基线,为解决美团外卖长用户行为序列推荐问题提供了有效方法。
美团外卖推荐系统的挑战与现有方法局限
-
长序列挑战:美团外卖作为本地零售和即时配送平台,部分用户年互动超 1000 次,传统 RNN 模型难以维持长序列记忆,注意力机制模型处理长序列计算成本高。
-
现有方法问题:两阶段推荐模型虽出现,但主要依赖静态特征过滤序列,未充分考虑上下文等动态因素,且基于目标注意力的方法计算开销大,依赖物品嵌入语义相似性推断偏好不可靠。
CoFARS 模型方法
-
问题表述:对用户 𝑢,用 $e_{1: n}^{u}$ 表示兴趣点(PoIs)交互序列,$C^{u}$ 表示不同上下文集合,$A$ 表示 PoI 属性集。目标是基于目标上下文识别相似偏好的上下文,用于过滤行为序列。
-
概率编码器
- 用 JS 散度衡量不同上下文 PoI 属性分布相似性,替代传统余弦相似性,增强可解释性与准确性。
- 引入偏好原型概念,设计概率编码器将潜在表示映射到 PoI 属性概率分布,通过最小化均方误差损失($L_{MSE}$)使估计 JS 散度逼近真实值,同时用独立性损失($L_{IND}$)约束原型分布。
-
基于图的时间聚合器:构建基于上下文顺序的时间图,节点为上下文,边为相邻上下文共现关系。将原型节点嵌入图中,用 Gumbel Softmax 技巧处理连接筛选,通过图注意力网络聚合图并嵌入时间信息。
-
学习与讨论:用 GRU 编码用户短期行为,结合目标上下文确定匹配原型,用二元交叉熵损失训练。推理时,对已遇和冷启动上下文分别采用不同策略处理,CoFARS 相比其他两阶段模型时间复杂度更低。
实验结果
-
实验设置:离线实验用 2023 年 4 月美团外卖日志数据训练,5 月 9 日数据验证,考虑多种用户和 PoI 特征,对比传统和长序列增强模型,统一参数设置,CoFARS 用 PyTorch 实现并调参。
-
性能比较:CoFARS 在 CTR AUC 和 CTCVR AUC 指标上优于所有基线模型,如相比 TWIN 分别提升 0.77%和 0.63%。变体实验表明基于 JS 散度的相似性度量、$L_{MSE}$、$L_{IND}$ 和图时间聚合器均有效。
-
消融研究:通过对比去除部分组件的变体,验证了基于 JS 散度、相关损失约束及 GNN 引入时间信息的设计有效。
-
原型数量影响:原型数量是超参数,约为 40 时 CoFARS 性能最佳,1 时因过滤序列短性能大幅下降。
-
可视化分析:对用户不同上下文偏好相似性可视化,结果表明相同上下文特征下用户偏好相似,且早餐订单相似性有其特点,所有上下文最小相似性体现基本偏好。
-
在线 A/B 测试:2023 年 5 - 6 月在线测试,CoFARS 使 CTR 提升 4.6%,GMV 提升 4.2%,已部署上线服务。