论文地址
论文总结
《An Attention - based Model for Conversion Rate Prediction with Delayed Feedback via Post - click Calibration》论文总结
-
摘要:本文提出了一种基于注意力的转化率预测模型,通过后点击校准来处理延迟反馈问题,该模型能够应对在线展示广告中转化率预测的两大挑战:数据稀缺和延迟反馈,通过提取预训练嵌入和使用注意力机制来捕捉用户兴趣,通过学习动态风险函数来校准延迟模型,实验证明了该方法的有效性。
-
相关工作:
- 现有工作主要利用传统模型进行转化率预测,如基于逻辑回归、GBDT、图模型等,但这些方法难以捕捉高度非线性的用户行为数据,深度学习框架被提出用于解决该问题。
- 时间延迟建模是转化率预测的重要部分,现有方法假设时间延迟分布是静态的,本文提出学习动态时间延迟分布。
-
模型:
- 转换模型:用于预测候选广告被点击后最终转化的概率,输入包括候选项目特征、用户历史点击项目、候选项目状态、点击与转化之间的时间延迟和点击后的经过时间。通过对齐和连接操作处理候选项目特征,使用一层GRU从用户点击历史中提取隐藏的转化兴趣,采用自注意力机制和内注意力机制提取全局和高级转化兴趣以及候选项目与历史行为的关系,最后计算项目转化的概率。
- 时间延迟模型:通过生存分析来估计时间延迟,利用后点击信息校准转化率预测。将生存分析转换为离散转换延迟分析,通过两层GRU模型提取后点击信息来学习动态风险函数,从而计算出任何一天的风险率。
- 学习算法:提出了一种新的期望最大化(EM)算法,将变量C视为隐藏变量,在E步计算C的期望,在M步分析数据集的对数似然损失并分别优化转换模型和时间延迟模型的参数。
-
实验:
- 实验设置:使用来自京东广告平台的三个数据集进行评估,选择多种基线模型进行比较,设置了相关的参数和优化器。
- 总体性能比较:TS - DL模型在所有数据集上的性能优于现有方法,并且 ablation study 表明时间延迟模块等重要组件对转化率预测至关重要。
- 深入转化率分析:TS - DL模型在分离正负样本方面表现最佳,且在所有数据集中具有最准确的平均转化率预测。
- 时间延迟分析:TS - DL模型在预测时间延迟方面的表现优于DFM和TS - DL / S基线模型,具有更小的Jensen - Shannon散度。
-
结论:
- 提出的两阶段深度学习框架能够解决转化率预测问题,未来工作将探索价格和品牌等元数据。
综上所述,本文提出的模型在转化率预测中具有较好的性能和应用前景。