论文地址
Modeling Delayed Feedback in Display Advertising
论文总结
《Modeling Delayed Feedback in Display Advertising》论文总结
-
摘要:本文主要解决在展示广告中由于转化率反馈延迟导致的建模问题,通过引入额外的模型来捕捉转化延迟,从而更准确地预测转化率。
-
引言:
- 展示广告中CPA支付模式需要估计印象的价值,而转化率的准确预测至关重要,但转化可能在点击后很长时间才发生,这导致了训练集匹配窗口长度的选择困境。
- 本文提出的解决方案不涉及匹配窗口,而是根据点击是否跟随转化来标记正样本和未标记样本,并引入第二个模型来捕捉转化延迟。
- 本文使用Criteo的流量日志进行实验,Criteo是一家在绩效展示广告领域处于全球领先地位的公司。
-
转化:
- 点击后归因:采用点击后归因模型,将转化归因于点击,转换窗口长度为30天,转换事件和点击事件需共享相同的用户标识符和广告商,对于多次点击导致的转换,归因于最后一次点击。
- 转化率预测:在CPA支付模型中,广告交换平台或DSP需要估计印象的价值,通过分解公式可以减少数据处理管道的负载,并更准确地预测某些情况的活动效果。
- 转化延迟分析:大部分转化发生在点击后的一小时内,但仍有部分转化发生得较晚,这对学习产生影响,短匹配窗口会错误地标记大量转化为负样本。
- 新活动:展示广告是一个非平稳过程,新活动的不断引入意味着等待30天来训练模型可能会对大部分流量预测不佳。
-
模型:
- 引入随机变量X表示特征,Y表示是否已发生转化,C表示用户是否最终会转化,D表示点击和转化之间的延迟(若C = 0则未定义),E表示自点击以来经过的时间。
- 使用两个参数模型,转换概率模型(逻辑回归模型)和转化延迟模型(指数分布)。
- 通过条件独立性假设,推导得出转化事件的概率和未观察到转化的概率表达式。
-
优化:
- 期望最大化(EM):通过EM算法推断隐藏变量C的值,从而解开两个模型。在E步计算后验概率,在M步最大化期望对数似然,该算法的缺点是收敛速度慢。
- 联合优化:使用梯度下降算法对正则化负对数似然进行优化,目标函数为,其中为负对数似然。通过分析未标记样本对转换模型的梯度影响,解释了模型在不同情况下的行为。
-
相关工作:
- 与从正样本和未标记数据中学习以及生存分析密切相关,但现有研究中关于正样本标签缺失的假设在本场景中不成立,因为标签是否缺失取决于自点击以来的时间。
- 与生存分析模型的联系在于极端情况下(用户总是转化),延迟模型可视为生存分析模型的扩展,其中审查时间根据转换概率进行加权。
- 之前关于展示广告转化率预测的工作没有解决转化延迟问题,本文将与一种合理的启发式方法进行比较。
-
实验评估:
- 玩具示例:通过模拟示例评估模型对新活动的反应速度,提出的延迟反馈模型(DFM)在两天后能正确预测转化率,而朴素方法会低估转化率。
- 转化延迟:分析转化延迟的总体分布,发现指数分布在延迟建模中是合理的,但存在一些偏差,延迟分布似乎是短延迟和长延迟的混合。
- 竞争模型:实现了一种称为短期转换模型(STC)的启发式方法作为对比,还包括朴素分类算法、Oracle、Shifted和Rescale等基线模型。
- 特征和设置:使用分类特征和交叉特征,通过哈希技巧映射为稀疏二进制特征向量,实验设置包括7天测试数据、3周训练数据、使用平均负对数似然(NLL)作为评估指标等。
- 结果:DFM方法比朴素基线提高了近3%的NLL,与Oracle方法的上限差距不大,在最近的活动中表现更好,朴素方法低估了转化率,Rescale方法校准更好,但在最近的活动中表现不佳,STC模型结果喜忧参半。
-
结论:
- 本文提出的技术通过建模转化延迟来解决转化率的滞后问题,易于实现,并且比一些基线方法提供了更准确的转化预测,可应用于任何需要用近期数据更新模型且标签可能延迟的问题。
综上所述,本文提出的模型在处理展示广告中的转化延迟问题上具有一定的有效性和优势。