论文地址:https://www.law.berkeley.edu/files/AIPW(1).pdf
《An Introduction to the Augmented Inverse Propensity Weighted Estimator》总结
作者为Adam N. Glynn和Kevin M. Quinn,文章主要讨论了用于平均治疗效果(ATE)估计的增强逆倾向加权(AIPW)估计器。
研究背景
AIPW估计器在社会科学中鲜为人知且未被广泛使用,但它具有吸引人的理论性质,且只要求从业者做两件他们熟悉的事情:为倾向得分指定二元回归模型,为结果变量指定回归模型。该估计器具有“双重稳健性”,即只要倾向得分模型或结果回归模型中有一个正确指定,它就对ATE保持一致。
主要内容
-
ATE的估计器:
- 基于回归模型的ATE估计器:传统因果估计依赖于结果变量的回归模型,通过子类调整、g - 功能或后门调整等方法可识别ATE,但当条件集Z高维时,该估计器可能表现不佳。
- 基于治疗分配模型的ATE估计器:另一类估计器依赖于治疗分配模型,如IPW估计器,当倾向得分已知时,它对ATE是无偏的且一致的,但当倾向得分接近0或1时,它可能具有较差的小样本性质。
-
AIPW估计器:
- 定义与使用:通过充分利用条件集信息改进IPW估计器,当估计的倾向得分和回归模型被其真实对应物替换时,调整项的期望为零,且当倾向得分接近0或1时,调整项能稳定估计器。
- 理论性质:AIPW估计器渐近正态分布,可导出有效的大样本标准误差,具有双重稳健性,即当倾向得分模型或两个结果回归模型正确指定时,它对ATE是一致的。
- 优缺点:可能在小样本中存在缺点,如估计的倾向得分高度可变时,AIPW估计器可能具有较大的方差,但大多数研究人员已经熟悉拟合倾向得分和结果变量的回归模型。
-
蒙特卡洛研究:
- 研究设计:包括低、中、高三种混淆程度,线性和非线性两种均值函数,以及250、500和1000三种样本大小,共18种蒙特卡洛数据集,每种数据集创建1000个,共18000个数据集。
-
结果:
- ATE估计器的偏差:在低混淆情况下,所有估计器基本无偏;在中、高混淆且结果均值函数为线性时,建模结果均值函数的估计器表现最佳;在中、高混淆且结果均值函数为非线性时,所有估计器都有一些有限样本偏差,但随着样本量增加而减小。
- ATE估计器的均方根误差(RMSE):在低混淆情况下,所有估计器的RMSE相似且随样本量增加而减小;在中混淆情况下,回归估计器和AIPW估计器在结果均值为线性时表现更好,IPW估计器在结果均值为非线性时与AIPW和回归估计器的差距减小;在高混淆且结果均值为线性时,回归和AIPW估计器明显优于匹配和IPW估计器,在结果均值为非线性时,情况更复杂。
- 不一致规格下的偏差:只有AIPW估计器在所有场景和模型规格下基本保持无偏,而其他估计器在模型规格部分不足时会表现出较大的偏差。
- 不一致规格下的RMSE:其他估计器的RMSE很少低于AIPW估计器,在某些情况下,其他估计器的RMSE比AIPW估计器高很多。
结论
AIPW估计器在完全正确的规格下与现存估计器表现相当,但在部分错误规格下表现明显更好,因此大多数应用研究人员应考虑使用AIPW估计器来估计ATE,同时文章还提供了关于如何指定AIPW估计器的两个关键部分(倾向得分模型和结果回归)的建议。