论文 | An Introduction to the Augmented Inverse Propensity Weighted Estimator（AIPW）

论文地址：https://www.law.berkeley.edu/files/AIPW(1).pdf

《An Introduction to the Augmented Inverse Propensity Weighted Estimator》总结

作者为Adam N. Glynn和Kevin M. Quinn，文章主要讨论了用于平均治疗效果（ATE）估计的增强逆倾向加权（AIPW）估计器。

研究背景

AIPW估计器在社会科学中鲜为人知且未被广泛使用，但它具有吸引人的理论性质，且只要求从业者做两件他们熟悉的事情：为倾向得分指定二元回归模型，为结果变量指定回归模型。该估计器具有“双重稳健性”，即只要倾向得分模型或结果回归模型中有一个正确指定，它就对ATE保持一致。

主要内容

ATE的估计器：
- 基于回归模型的ATE估计器：传统因果估计依赖于结果变量的回归模型，通过子类调整、g - 功能或后门调整等方法可识别ATE，但当条件集Z高维时，该估计器可能表现不佳。
- 基于治疗分配模型的ATE估计器：另一类估计器依赖于治疗分配模型，如IPW估计器，当倾向得分已知时，它对ATE是无偏的且一致的，但当倾向得分接近0或1时，它可能具有较差的小样本性质。
AIPW估计器：
- 定义与使用：通过充分利用条件集信息改进IPW估计器，当估计的倾向得分和回归模型被其真实对应物替换时，调整项的期望为零，且当倾向得分接近0或1时，调整项能稳定估计器。
- 理论性质：AIPW估计器渐近正态分布，可导出有效的大样本标准误差，具有双重稳健性，即当倾向得分模型或两个结果回归模型正确指定时，它对ATE是一致的。
- 优缺点：可能在小样本中存在缺点，如估计的倾向得分高度可变时，AIPW估计器可能具有较大的方差，但大多数研究人员已经熟悉拟合倾向得分和结果变量的回归模型。
蒙特卡洛研究：
- 研究设计：包括低、中、高三种混淆程度，线性和非线性两种均值函数，以及250、500和1000三种样本大小，共18种蒙特卡洛数据集，每种数据集创建1000个，共18000个数据集。
- 结果：
  - ATE估计器的偏差：在低混淆情况下，所有估计器基本无偏；在中、高混淆且结果均值函数为线性时，建模结果均值函数的估计器表现最佳；在中、高混淆且结果均值函数为非线性时，所有估计器都有一些有限样本偏差，但随着样本量增加而减小。
  - ATE估计器的均方根误差（RMSE）：在低混淆情况下，所有估计器的RMSE相似且随样本量增加而减小；在中混淆情况下，回归估计器和AIPW估计器在结果均值为线性时表现更好，IPW估计器在结果均值为非线性时与AIPW和回归估计器的差距减小；在高混淆且结果均值为线性时，回归和AIPW估计器明显优于匹配和IPW估计器，在结果均值为非线性时，情况更复杂。
  - 不一致规格下的偏差：只有AIPW估计器在所有场景和模型规格下基本保持无偏，而其他估计器在模型规格部分不足时会表现出较大的偏差。
  - 不一致规格下的RMSE：其他估计器的RMSE很少低于AIPW估计器，在某些情况下，其他估计器的RMSE比AIPW估计器高很多。

结论

AIPW估计器在完全正确的规格下与现存估计器表现相当，但在部分错误规格下表现明显更好，因此大多数应用研究人员应考虑使用AIPW估计器来估计ATE，同时文章还提供了关于如何指定AIPW估计器的两个关键部分（倾向得分模型和结果回归）的建议。

论文 | An Introduction to the Augmented Inverse Propensity Weighted Estimator（AIPW）

论文相关文章

因果推断相关文章

最近热门

最常浏览