复杂处理下的因果推断：综述

创作时间:

作者:

@小白创作中心

引用

CSDN

https://blog.csdn.net/weixin_43145427/article/details/141677151

本文是一篇关于复杂处理下因果推断方法的综述性文章，主要讨论了多值、连续和捆绑处理等复杂情况下的因果推断方法。文章结构清晰，内容详实，涵盖了各种处理方法的分类、具体方法的介绍以及存在的挑战和未来方向。文章还提供了相关的公开数据集和开源代码资源，具有较高的学术价值和实用价值。

二元处理方法一般分为无混淆假设下的方法和存在未观测混杂因素的方法。

基于广义倾向得分的方法 (GPS-based Methods)：广义倾向得分（GPS）是一种扩展版的倾向得分，适用于处理变量有多个离散值的情况。GPS可以帮助匹配相似的个体或者调整权重以估计平均处理效应。
树基模型 (Tree-based Models)：这类方法利用决策树来分析数据，并可以扩展到多类处理情况。例如，CTS方法使用树结构来确定最佳处理值。
基于表示的方法 (Representation-based Methods)：这些方法通过学习共享平衡表示来减少处理组间的偏差，同时考虑所有处理组的假设函数。例如，VARTS方法就是基于表示的学习方法。
生成建模方法 (Generative Modeling Methods)：这类方法使用生成模型，如生成对抗网络 (GAN)，来估计多值处理的效果。例如，GANITE方法通过对抗训练来估计处理效果。
元学习方法 (Meta Learning Methods)：这些方法利用元学习框架来提高跨域的一般化能力。MetaITE方法就是在元学习框架下的一种方法，它通过构建支持集和查询集来优化模型。

基于信息的多重因果估计 (MCEI)：这种做法尝试恢复未观测混杂因素的代理变量。它包括两个假设：一是所有处理共享相同的混杂因素；二是给定混杂因素后处理之间相互独立。MCEI通过最大化一个目标函数来估计潜在的结果，该目标函数考虑了处理和未观测混杂因素之间的附加互信息。

加权方法：受到逆概率加权（IPW）的启发，提出了逆广义倾向评分（IGPS）。为了应对IGPS中可能出现的极端值问题，又提出了稳定版本的SIGPS。
协变量平衡广义倾向评分（CBGPS）：这是CBPS的扩展，用于连续处理设置。其目的是消除处理T和协变量X之间的相关性。CBGPS通过确保GPS的平衡属性来达到这个目的。
双重鲁棒方法：这些方法结合了加权方法和回归方法的优点，即使其中一个模型被错误地指定也能提供一致的估计。
基于表示的方法：这些方法通过学习一个低维表示空间来平衡协变量，使得在这个空间内处理和协变量之间的关系变得不相关。
生成建模方法：这些方法通常使用生成对抗网络（GANs）或其他生成模型来模拟处理和结果之间的分布，从而估计因果效应。