论文地址
[2002.02068] A Feedback Shift Correction in Predicting Conversion Rates under Delayed Feedback
论文总结
《A Feedback Shift Correction in Predicting Conversion Rates under Delayed Feedback》论文总结
-
摘要:本文针对展示广告中转化率预测存在的延迟反馈问题,提出使用重要性权重(IW)方法进行反馈偏移校正,通过实验证明了该方法优于现有方法。
-
相关工作:
- 介绍了延迟反馈问题在转化率预测中的研究现状,一些研究尝试解决该问题,且该问题与正样本未标记学习相关。
- 反馈偏移与协变量偏移相关,后者已被广泛研究,标签偏移是反馈偏移的一般情况,延迟反馈在bandit算法中也有研究。
-
预分析:
- 通过分析Criteo和Dynalyst数据集,表明点击和转化之间存在延迟,且延迟会导致训练数据和测试数据的标签分布不同,仅等待固定时间窗口来解决延迟问题不是最佳方式。
- Criteo数据集存在24小时周期性,不同活动的周期性模式不同,本文提出的IW方法可以捕捉延迟分布的振荡形状,从而改进转化率预测。
-
延迟反馈:
- 延迟反馈公式化:定义了相关随机变量,在延迟反馈中,一些正样本会被误标记为负样本,导致训练数据中的负样本包括假负样本和真负样本,将延迟反馈视为训练和测试数据中条件标签分布的差异,即反馈偏移。
- 问题公式化:在转化率预测中,目标是估计,但由于无法观察到C,只能使用Y来训练模型,延迟反馈导致训练和测试数据的分布差异,使得经验风险最小化估计器不一致,从而导致转化率预测器倾向于向下偏差。
-
重要性权重(IW)方法:
- 理论背景:定义了使用FSIW加权的损失,证明了在反馈偏移下,该损失是一致的,即可以通过最小化该损失来获得一致的估计器,但由于无法直接估计FSIW,需要间接估计。
- 估计FSIW:通过点击后的经过时间和其他特征,分别估计真阳性发生概率的倒数和真阴性发生概率,通过创建人工数据集来估计这两个概率。
-
实验:
-
公共数据集:Criteo数据集:
- 数据集和指标:使用Criteo数据集,与现有方法进行比较,使用log loss(LL)、area under the precision - recall curve(PR - AUC)和normalized log loss(NLL)作为评估指标。
- FSIW估计和超参数:使用LightGBM估计FSIW,设置不同的超参数,使用估计的FSIW作为样本权重训练模型预测转化率。
-
结果:与DFM和LR相比,本文提出的方法在LL和NLL上有显著改进,训练时间也大大缩短,且不同的反事实截止日期对方法的稳定性影响较小。
- 数据集:Dynalyst数据集:
-
数据集和指标:使用Dynalyst的内部数据集,包括三个活动,根据活动的观测期设置不同的反事实截止日期,使用FFM和FFMIW进行评估。
- FSIW估计和超参数:估计FSIW的超参数与之前实验相同,使用FFM学习转化率预测器,并设置相关超参数。
- 结果:在所有活动中,FFMIW似乎优于FFM,但只有Campaign L中NLL的差异具有统计学意义。
- 在线实验:在Campaign L中对FFM和FFMIW进行了14天的A / B测试,结果表明FFMIW在成本和转化率方面表现更好,但CPA没有显著差异。
-
-
结论:本文提出的使用IW技术的方法在Criteo数据集上表现优于现有方法,将IW方法应用于FFM并在内部数据集上进行实验,以及在线A / B测试均证明了该方法的有效性。