image_2025-03-05_19-34-17.jpg

论文地址

[1905.09248] Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction

论文介绍

“Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction”由Qi Pi、Weijie Bian等人撰写。文章针对点击率(CTR)预测任务中长序列用户行为建模难题,提出机器学习算法与在线服务系统协同设计方案,经实验验证效果良好,已应用于阿里巴巴展示广告系统。

  1. 研究背景与挑战

    • CTR预测的重要性:CTR预测对推荐系统和在线广告意义重大,深度学习推动了深度CTR模型发展,但复杂模型在线部署面临挑战。
    • 长序列用户行为数据的难题:处理长序列用户行为数据时,系统延迟和存储成本随序列长度近似线性增加,现有模型难以应对。
  2. 相关工作

    • 深度CTR模型:基于深度学习的CTR预测方法不断涌现,从学习特征交互到捕捉用户兴趣,但处理长序列行为数据时,存储和计算压力大。
    • 长期用户兴趣建模:部分方法通过特征工程建模长期用户兴趣,基于深度学习的方法在长序列数据处理上存在局限。
    • 记忆网络:在NLP领域广泛应用,部分研究用于用户兴趣建模,但忽视长期兴趣建模和实际部署问题。
  3. 实时CTR预测系统

    • 系统挑战:长序列用户行为数据带来存储和延迟挑战,如阿里巴巴系统中,存储长序列行为数据成本高,现有模型处理长序列时延迟大幅增加。
    • 用户兴趣中心(UIC):设计UIC模块,独立于请求更新用户兴趣表示,为实时CTR预测消除延迟,显著降低模型延迟。
  4. 多通道用户兴趣记忆网络(MIMN)

    • 学习长序列数据的挑战:简单RNNs处理长序列效果不佳,注意力机制虽增强模型表达能力,但带来存储和计算问题。
    • MIMN模型设计:借鉴NTM思想,由处理用户行为序列的左子网络和传统Embedding&MLP范式的右子网络组成。
    • 关键组件:提出内存利用正则化平衡内存槽写入权重方差,增强内存存储能力;设计内存归纳单元(MIU)捕捉高阶信息,提升用户兴趣提取能力。
    • 在线服务实现:MIMN在UIC服务器和RTP服务器分布式实现,增量计算更新用户兴趣表示,减少数据存储量。
  5. 实验评估

    • 实验设置:使用两个公共数据集和阿里巴巴在线展示广告系统的工业数据集,以AUC为评估指标,对比多种模型。
    • 实验结果:MIMN在公共数据集和工业数据集上均优于对比模型,消融实验验证了各模块有效性。在工业系统中,MIMN相比DIEN,AUC提升0.01,在线A/B测试中,CTR提升7.5%,RPM提升6%。
    • 部署经验:同步UIC和RTP服务器可降低异步更新风险;去除大促数据效果更好;采用预热策略初始化UIC,设计回滚策略应对异常情况。
  6. 研究结论:提出的UIC和MIMN协同设计方案有效解决长序列用户行为建模难题,为工业应用开辟新方向,未来将在算法、训练和在线服务系统方面进一步研究。