反事实预测和选择偏差是因果效应估计中的重大挑战。为对潜在协变量的复杂混杂分布进行有效表征,同时增强反事实预测泛化能力,提出一种面向工业因果效应估计应用的重加权对抗变分自编码器网络(RVAENet)模型。针对混杂分布去偏问题,借鉴...反事实预测和选择偏差是因果效应估计中的重大挑战。为对潜在协变量的复杂混杂分布进行有效表征,同时增强反事实预测泛化能力,提出一种面向工业因果效应估计应用的重加权对抗变分自编码器网络(RVAENet)模型。针对混杂分布去偏问题,借鉴域适应思想,采用对抗学习机制对由变分自编码器(VAE)获得的隐含变量进行表示学习的分布平衡;在此基础上,通过学习样本倾向性权重对样本进行重加权,进一步缩小实验组(Treatment)与对照组(Control)样本间的分布差异。实验结果表明,在工业真实场景数据集的两个场景下,所提模型的提升曲线下的面积(AUUC)比TEDVAE(Treatment Effect with Disentangled VAE)分别提升了15.02%、16.02%;在公开数据集上,所提模型的平均干预效果(ATE)和异构估计精度(PEHE)普遍取得最优结果。展开更多
目的利用SAS开发的CAUSALTRT过程,实现三类估计方法的因果效应估计。方法采用SmokingWeight数据集,以戒烟为处理变量,体重变化为结局变量,其他因素为混杂变量,通过增强逆概率加权法(augmented inverse probability weighting,AIPW)对平...目的利用SAS开发的CAUSALTRT过程,实现三类估计方法的因果效应估计。方法采用SmokingWeight数据集,以戒烟为处理变量,体重变化为结局变量,其他因素为混杂变量,通过增强逆概率加权法(augmented inverse probability weighting,AIPW)对平均处理效应(the average treatment effect,ATE)进行估计,通过回归调整法(regression adjustment,REGADJ)对处理组平均处理效应(the average treatment effect for the treated,ATT)进行估计。结果戒烟对体重变化的ATE和ATT分别为3.209(95%CI:2.232~4.187)和3.276(95%CI:2.332~4.219)。结论CAUSALTRT可以实现不同的因果效应估计,但应用时需要考虑其是否满足前提假设以及注意事项。展开更多
在随机处理——对照的临床试验中,除出现完全依从和完全不依从的现象外,还会出现部分依从的现象,即患者只服用部分药品。在仅出现完全依从和不依从情况时,Balke and Pearl利用线性规划的方法获得了ACE估计量的上下界,对于部分依从的情况...在随机处理——对照的临床试验中,除出现完全依从和完全不依从的现象外,还会出现部分依从的现象,即患者只服用部分药品。在仅出现完全依从和不依从情况时,Balke and Pearl利用线性规划的方法获得了ACE估计量的上下界,对于部分依从的情况,是将这些数据全部并入完全依从的数据,这样处理的合理性没有论述。同时,利用他们所提供的方法,有时会出现下界为负数,显然,这样的下界没什么实际意义。本文根据Angrist,Imbebns&Rubin讨论工具变量时所提出一些假设条件,导出了在部分依从情况下,计算ACE估计量的上下界的方法,并证明了其下界一定是非负的。展开更多
文摘反事实预测和选择偏差是因果效应估计中的重大挑战。为对潜在协变量的复杂混杂分布进行有效表征,同时增强反事实预测泛化能力,提出一种面向工业因果效应估计应用的重加权对抗变分自编码器网络(RVAENet)模型。针对混杂分布去偏问题,借鉴域适应思想,采用对抗学习机制对由变分自编码器(VAE)获得的隐含变量进行表示学习的分布平衡;在此基础上,通过学习样本倾向性权重对样本进行重加权,进一步缩小实验组(Treatment)与对照组(Control)样本间的分布差异。实验结果表明,在工业真实场景数据集的两个场景下,所提模型的提升曲线下的面积(AUUC)比TEDVAE(Treatment Effect with Disentangled VAE)分别提升了15.02%、16.02%;在公开数据集上,所提模型的平均干预效果(ATE)和异构估计精度(PEHE)普遍取得最优结果。
文摘目的利用SAS开发的CAUSALTRT过程,实现三类估计方法的因果效应估计。方法采用SmokingWeight数据集,以戒烟为处理变量,体重变化为结局变量,其他因素为混杂变量,通过增强逆概率加权法(augmented inverse probability weighting,AIPW)对平均处理效应(the average treatment effect,ATE)进行估计,通过回归调整法(regression adjustment,REGADJ)对处理组平均处理效应(the average treatment effect for the treated,ATT)进行估计。结果戒烟对体重变化的ATE和ATT分别为3.209(95%CI:2.232~4.187)和3.276(95%CI:2.332~4.219)。结论CAUSALTRT可以实现不同的因果效应估计,但应用时需要考虑其是否满足前提假设以及注意事项。
基金supported by the National Natural Science Foundation of China(72071187,11671374,71731010,71921001)Fundamental Research Funds for the Central Universities(WK3470000017,WK2040000027)。
文摘在随机处理——对照的临床试验中,除出现完全依从和完全不依从的现象外,还会出现部分依从的现象,即患者只服用部分药品。在仅出现完全依从和不依从情况时,Balke and Pearl利用线性规划的方法获得了ACE估计量的上下界,对于部分依从的情况,是将这些数据全部并入完全依从的数据,这样处理的合理性没有论述。同时,利用他们所提供的方法,有时会出现下界为负数,显然,这样的下界没什么实际意义。本文根据Angrist,Imbebns&Rubin讨论工具变量时所提出一些假设条件,导出了在部分依从情况下,计算ACE估计量的上下界的方法,并证明了其下界一定是非负的。