纵向数据因果推断中的双稳健半参数效应模型研究

基本信息

批准号：81473071

项目类别：面上项目

资助金额：70.00

负责人：王素珍

学科分类：

依托单位：潍坊医学院

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：李伟,吕军城,石福艳,任艳峰,安洪庆,秦浩,黄天资,赵晓蒙,孟维静

关键词：

双稳健性倾向评分因果推断纵向数据半参数模型

结项摘要

Estimation of treatment effects with causal interpretation from longitudinal data is complicated because exposure to treatment may be confounded with subject characteristics. Propensity Score, which utilizes modeling construction, regression and covariate adjustment synthetically, can effectively eliminate the biases caused by the imbalance of covariates and offer improved precision for the evaluation of treatment effect. However, there are many unresolved issues for PS methods. The applications of PS in the bias control of longitudinal data have been limited due to uncorrect specifications of PS model or statistical hypothesis.In this study we will dig the biases resulted from unbalance of covariates and explore the effect of biases on treatment and outcome variables for longitudinal data from tumor patients so as to make it clear that it is very important to adjust the cofoundings among groups by PS methods. The theories of unbised treatment effect estimation will be clarified and the construction of double robust semiparametric unbiased effect model for causal effect inference in longitudinal data will be determined.

纵向数据研究中，估计处理效应、做出因果推断是非常复杂的，因为暴露于不同处理组的个体特征不同，因而组间协变量的分布并不均衡，处理效应的估计可能会出现偏倚。倾向评分（Propensity Score,PS）综合运用建模、回归、分层、加权等方法，能够较好地消除协变量不均衡引起的偏倚，对处理效应评价的准确性大大提高。然而PS本身存在许多尚未解决的问题，尤其是PS模型的指定以及与其相关的统计学假设检验方法的选择问题，限制了其在纵向数据偏倚控制中的应用。本研究拟从肿瘤患者纵向随访数据入手，研究组间协变量不均衡引起的偏倚及其对处理因素和结局变量的影响,探讨利用PS方法调整组间混杂因素的重要性，阐明纵向数据因果推断中处理效应无偏估计的理论依据，确定双稳健半参数无偏效应模型的构建方法。

项目摘要

纵向数据具有信息量大、协变量多、影响因果推断效应的因素复杂等特点。该类数据中的协变量受个体特征的影响，在组间分布通常不均衡，因此导致处理效应的估计出现偏倚，对该类数据的因果推断非常复杂。倾向评分法（Propensity Score,PS）综合运用建模、回归、分层、加权等方法，能够较好地消除协变量不均衡引起的偏倚，使处理效应估计及因果推断的准确性大大提高。然而PS本身存在许多尚未解决的问题，尤其是PS模型的指定以及与其相关的统计学假设检验方法的选择问题，限制了其在纵向数据偏倚控制中的应用。基于上述问题，本项目进行了探索，主要完成了以下几个方面的研究：首先对纵向数据偏倚来源进行了探索，通过Monte Carlo模拟研究了组间协变量不均衡引起的偏倚及其对处理因素和结局变量的影响，通过协变量选择的多种变化模拟指定了PS的不同模型，研究其对因果推断效应的影响，探讨了利用PS方法调整组间混杂因素的重要性，确定了稳健性条件下PS模型中协变量选择的方法，并通过真实数据进行了验证。其次，对基于Logistic回归及基于广义提升模型的PS算法构建进行了理论探索、模拟对比和实证研究，构建了基于广义提升模型的PS算法，获得了稳定的逆概率权重，并将之应用于多组PS分层法、多组逆概率加权法以及分层合并逆概率加权法中。第三，对双稳健半参数模型平衡混杂偏倚、无偏估计因果效应进行了模拟和实证研究。确定了逆概率加权法和双稳健半参数效应模型的理论基础及计算公式。模拟了4种不同情景下，6种不同协变量选择模型下双稳健模型的构建方法及其对因果效应的无偏估计方法，并进行了实证研究。通过模拟和实证研究确定了双稳健半参数模型的稳健性及因果效应估计的无偏性。第四，采用标准化偏倚和分布统计量的变化衡量并解释了协变量的均衡性，阐明了PS分层法、逆概率加权法、双稳健半参数模型等均有较好的均衡组间混杂偏倚的能力。本研究提出的纵向临床数据 “后”随机化的方法，对于非随机化临床观测数据的混杂偏倚控制具有重要的参考价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.7524 /j.issn.0254-6108.2017122903

发表时间：2018

DOI：10.7606/j.issn.1000-7601.2021.04.29

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：

发表时间：2016

王素珍的其他基金

批准号：81872719

批准年份：2018

资助金额：58.00

项目类别：面上项目

批准号：81141112

批准年份：2011

资助金额：10.00

项目类别：专项基金项目

批准号：71063011

批准年份：2010

资助金额：22.00

项目类别：地区科学基金项目

相似国自然基金

基于半参数模型的纵向数据的稳健统计推断方法

批准号：10371042

批准年份：2003

负责人：朱仲义

学科分类：A0403

资助金额：17.00

项目类别：面上项目

纵向缺失数据下半参数模型的稳健统计推断

批准号：11701156

批准年份：2017

负责人：刘娟芳

学科分类：A0403

资助金额：23.00

项目类别：青年科学基金项目

复杂数据半参数模型的稳健统计推断研究

批准号：11901508

批准年份：2019

负责人：孙慧慧

学科分类：A0403

资助金额：24.00

项目类别：青年科学基金项目

纵向数据动态模型的稳健统计推断

批准号：11701361

批准年份：2017

负责人：柳树

学科分类：A0403

资助金额：20.00

项目类别：青年科学基金项目

纵向数据因果推断中的双稳健半参数效应模型研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选

一种基于多层设计空间缩减策略的近似高维优化方法

复杂系统科学研究进展

基于MCPF算法的列车组合定位应用研究

王素珍的其他基金

广义提升模型和机器学习下基于逆概率加权的纵向数据因果推断研究

肿瘤医院临床观测数据倾向指数方法研究

农村基本药物流通安全监管模式的研究——以江西为例

相似国自然基金