《A Survey of Deep Causal Models and Their Industrial Applications》 作者为Zongyu LiXiaobo GuoSiwei Qiang,该论文对深度因果模型及其在工业中的应用进行了综述。

研究背景和意义

  • 因果推断近年来成为热门研究话题,主流的因果推断框架包括因果发现、结构因果模型和罗宾因果模型。
  • 深度学习在大数据中的应用推动了因果效应估计的发展,深度因果模型在部分样本的观察数据中用于因果效应估计。
  • 现有关于因果模型的综述较少从有偏样本观察的角度进行系统全面的概述,本文旨在填补这一空白。

主要内容

  1. 引言

    • 介绍因果关系的三个层次,以及主流的因果推断框架和方法。
    • 阐述深度学习在因果效应估计中的应用,以及现有研究的不足。
    • 说明本文的研究内容和贡献,包括对深度因果模型的全面概述、典型应用的介绍以及相关数据集和实验的分析。
  2. 预备知识

    • 介绍因果效应估计的任务描述、数学概念和相关假设。
    • 给出因果效应估计的基本定义,包括治疗、观察结果、反事实结果、连续治疗和协变量等。
    • 阐述实现因果治疗效果估计所需的三个假设,即稳定样本治疗值假设、可忽略性假设和重叠假设。
  3. 治疗和指标

    • 分析二元治疗、多重治疗和连续治疗场景下的性能指标差异,扩展了基本指标的评估范围。
    • 介绍二元治疗中最基本的平均治疗效果(ATE)、条件平均治疗效果(CATE)、个体治疗效果(ITE)、平均治疗效果对治疗组(ATT)等指标,以及用于评估的IHDP、Twins等数据集和相应的计算方法。
    • 说明多重治疗中除了ATE和CATE外,还可使用均方根误差(RMSE)来准确估计治疗效果,以及用于评估的News数据集和计算方法。
    • 阐述连续治疗中采用样本剂量响应曲线和平均积分平方误差(MISE)、平均剂量策略误差(DPE)、平均政策误差(PE)等指标来衡量治疗效果,以及用于评估的TCGA数据集和相应的计算方法。
  4. 深度因果模型的发展

    • 按时间线梳理了从2016年6月到2022年11月约50个经典深度因果模型的发展,展示了模型类别和关系。
    • 将深度因果模型分为学习平衡表示、协变量混杂学习、基于GAN的反事实模拟、时间序列因果估计和多治疗及连续剂量治疗等五类,并进行详细分类和分析。
    • 典型深度因果模型

    • 从学习平衡表示、协变量混杂学习、基于GAN的反事实模拟、时间序列因果估计和多治疗及连续剂量治疗等五个方面,详细介绍了典型的深度因果模型,包括BNN、CFRNet、CEVAE、GANITE、STTE、R - MSN、PM、TECE - VAE、CTAM、Dragonnet、ACE、DKLITE、GAD、CRN、TSD、ABCEI、SCIGAN、DRNet、VCNet、CETransformer、DeR - CFR、SCI、FlexTENet、SCP、CGN、SyncTwin、TransTEE、DSW、CBRE、CT等。

    • 分析了这些模型的架构、原理、应用场景以及面临的问题和挑战。
  5. 工业应用现状

    • 介绍深度因果模型在营销、电子商务、金融、经济、医学和教育等六个领域的应用。
    • 阐述深度因果模型在这些领域的优势,包括在表示学习、处理高维数据和适应复杂结构等方面。
    • 详细介绍了每个领域中的具体应用案例和相关模型,如营销中的激励分配和用户留存模型、电子商务中的推荐系统和去偏方法、金融中的政策评估和风险分析、经济中的因果效应估计和政策制定、医学中的精准医疗和治疗效果评估、教育中的政策评估和学生表现预测等。
  6. 实验指南

    • 介绍了用于因果分析的一些公开数据集,包括IHDP、Jobs、Twins、News、TCGA、ACIC、肿瘤生长、MIMIC III、NICO、ADNI、CHESS、CPRD、BlogCatalog和Flickr等,并说明了它们的来源、应用场景和相关特点。
    • 总结了与深度学习相关的源代码和编程框架,主流框架为PyTorch和TensorFlow,同时列出了一些代表性模型的源代码及相关数据集。
    • 分别对二元治疗、多重治疗和连续治疗场景在上述数据集上的实验设置和结果进行了总结,展示了不同模型在各个数据集上的性能表现。
  7. 结论和未来展望

    • 总结了深度因果模型的发展历程,以及其在因果效应估计中的应用和对相关领域的影响。
    • 提出了深度因果模型在工业应用中的未来展望,包括营销中深度学习的可解释性和公平性、电子商务中通用去偏框架的需求、金融和经济中数据整合和不确定性量化、医学和教育中处理高维数据和扩展应用场景等方面。

总结

本文全面综述了深度因果模型的发展、分类和典型模型,分析了其在工业应用中的现状和前景,并提供了实验指南,对相关数据集、源代码和实验结果进行了详细总结,为进一步研究和应用深度因果模型提供了有价值的参考。