《Direct Heterogeneous Causal Learning for Resource Allocation Problems in Marketing》论文总结
[2211.15728] Direct Heterogeneous Causal Learning for Resource Allocation Problems in Marketing
-
摘要:本文提出了一种基于决策因素解决资源分配问题的新方法,通过将决策因素作为学习目标,避免了对预测结果进行替代数学运算,从而减轻了现有两阶段方法中模型预测误差不被尊重和累积误差增加的缺陷。文章将该方法应用于营销中的两个关键问题:二元治疗分配问题和多治疗预算分配问题,并通过大规模模拟和在线A/B测试验证了其有效性。
-
相关工作:
- 介绍了现有解决资源分配问题的两阶段方法,即机器学习和运筹学相结合,但该方法存在中间计算复杂、模型预测误差不被尊重和累积误差增加等缺陷。
- 提及了直接学习方法,如政策学习和强化学习,它们避免了机器学习和运筹学的结合,但存在资源约束移动到奖励函数中,导致模型需要随拉格朗日乘数变化而改变的问题。
- 与决策聚焦学习(DFL)的动机相似,本文致力于基于下游优化任务而不是预测精度来学习模型参数,但现有DFL工作对决策变量的可行区域有固定且确定的要求,与本文方法不同。
-
二元治疗分配问题:
- 问题定义:将部分个体分配营销行动,以最大化平台整体收益,同时要求增量成本不超过有限预算。
- 成本无关的治疗分配问题:提出了一种新的提升模型,直接预测或其排名,通过最小化损失函数可获得的无偏估计。
- 成本相关的治疗分配问题:提出了一种新的学习模型直接预测个体的ROI,设计的凸损失函数在损失收敛时可保证ROI的无偏估计。
-
多治疗预算分配问题:
- 问题定义:在有限预算下,为每个个体分配一定的治疗,以优化平台的整体收益。
- 组合优化算法:介绍了使用拉格朗日对偶理论解决该问题的方法,但直接预测决策因素对于所有可能的是困难且不现实的,因此提出了一个等效的优化算法,将作为决策因素。
- 直接预测模型:基于上述分析,提出了一种直接预测的新方法,通过最小化损失函数可获得的无偏估计。
- 评估指标:提出了一种新的评估指标MT - AUCC,用于评估不同治疗下个体边际效用的预测结果。
-
评估:
- 离线模拟:使用真实世界数据集和营销数据集进行实验,评估指标包括AUUC、AUCC和MT - AUCC等,基准模型包括S - Learner、X - Learner、Causal Forest和DUM等。实验结果表明,本文提出的模型在各个问题上均优于现有模型,且更稳定、方差更低。
- 在线A/B测试:在美团进行了为期四周的在线A/B测试,结果表明本文提出的DPM方法在增量订单和GMV方面均优于TPM - CF,平均实现了14.3%的增量订单增长和13.6%的GMV增长。
-
结论:
- 本文提出的方法在解决营销中的资源分配问题上具有理论和实践优势,未来工作将关注该方法在更复杂营销场景中的应用。
综上所述,本文提出的基于决策因素的资源分配问题解决方法在营销领域具有重要的应用价值和潜力。