Estimation of treatment effects with causal interpretation from longitudinal data is complicated because exposure to treatment may be confounded with subject characteristics. Propensity Score, which utilizes modeling construction, regression and covariate adjustment synthetically, can effectively eliminate the biases caused by the imbalance of covariates and offer improved precision for the evaluation of treatment effect. However, there are many unresolved issues for PS methods. The applications of PS in the bias control of longitudinal data have been limited due to uncorrect specifications of PS model or statistical hypothesis.In this study we will dig the biases resulted from unbalance of covariates and explore the effect of biases on treatment and outcome variables for longitudinal data from tumor patients so as to make it clear that it is very important to adjust the cofoundings among groups by PS methods. The theories of unbised treatment effect estimation will be clarified and the construction of double robust semiparametric unbiased effect model for causal effect inference in longitudinal data will be determined.
纵向数据研究中,估计处理效应、做出因果推断是非常复杂的,因为暴露于不同处理组的个体特征不同,因而组间协变量的分布并不均衡,处理效应的估计可能会出现偏倚。倾向评分(Propensity Score,PS)综合运用建模、回归、分层、加权等方法,能够较好地消除协变量不均衡引起的偏倚,对处理效应评价的准确性大大提高。然而PS本身存在许多尚未解决的问题,尤其是PS模型的指定以及与其相关的统计学假设检验方法的选择问题,限制了其在纵向数据偏倚控制中的应用。本研究拟从肿瘤患者纵向随访数据入手,研究组间协变量不均衡引起的偏倚及其对处理因素和结局变量的影响,探讨利用PS方法调整组间混杂因素的重要性,阐明纵向数据因果推断中处理效应无偏估计的理论依据,确定双稳健半参数无偏效应模型的构建方法。
纵向数据具有信息量大、协变量多、影响因果推断效应的因素复杂等特点。该类数据中的协变量受个体特征的影响,在组间分布通常不均衡,因此导致处理效应的估计出现偏倚,对该类数据的因果推断非常复杂。倾向评分法(Propensity Score,PS)综合运用建模、回归、分层、加权等方法,能够较好地消除协变量不均衡引起的偏倚,使处理效应估计及因果推断的准确性大大提高。然而PS本身存在许多尚未解决的问题,尤其是PS模型的指定以及与其相关的统计学假设检验方法的选择问题,限制了其在纵向数据偏倚控制中的应用。基于上述问题,本项目进行了探索,主要完成了以下几个方面的研究:首先对纵向数据偏倚来源进行了探索,通过Monte Carlo模拟研究了组间协变量不均衡引起的偏倚及其对处理因素和结局变量的影响,通过协变量选择的多种变化模拟指定了PS的不同模型,研究其对因果推断效应的影响,探讨了利用PS方法调整组间混杂因素的重要性,确定了稳健性条件下PS模型中协变量选择的方法,并通过真实数据进行了验证。其次,对基于Logistic回归及基于广义提升模型的PS算法构建进行了理论探索、模拟对比和实证研究,构建了基于广义提升模型的PS算法,获得了稳定的逆概率权重,并将之应用于多组PS分层法、多组逆概率加权法以及分层合并逆概率加权法中。第三,对双稳健半参数模型平衡混杂偏倚、无偏估计因果效应进行了模拟和实证研究。确定了逆概率加权法和双稳健半参数效应模型的理论基础及计算公式。模拟了4种不同情景下,6种不同协变量选择模型下双稳健模型的构建方法及其对因果效应的无偏估计方法,并进行了实证研究。通过模拟和实证研究确定了双稳健半参数模型的稳健性及因果效应估计的无偏性。第四,采用标准化偏倚和分布统计量的变化衡量并解释了协变量的均衡性,阐明了PS分层法、逆概率加权法、双稳健半参数模型等均有较好的均衡组间混杂偏倚的能力。本研究提出的纵向临床数据 “后”随机化的方法,对于非随机化临床观测数据的混杂偏倚控制具有重要的参考价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于半参数模型的纵向数据的稳健统计推断方法
纵向缺失数据下半参数模型的稳健统计推断
复杂数据半参数模型的稳健统计推断研究
纵向数据动态模型的稳健统计推断