数据缺失对依时混杂偏倚控制的影响及处理方法研究

基本信息
批准号:81602939
项目类别:青年科学基金项目
资助金额:17.00
负责人:刘慧鑫
学科分类:
依托单位:北京大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:张华,刘岩,杨明,杜依青,盛正祚
关键词:
缺失值依时混杂偏倚队列研究
结项摘要

In cohort studies, the uncontrolled time-depedent confounding could lead to biased results. Lately, marginal structural models were proposed to control the time-depedent confounding bias. In cohort studies, missing data is a common problem, which also impact the control of the time-dependent confounding bias. In our former studies, we used last observation carried forward method and multiple imputation to deal with the missing data of time-dependent confounder, which lead to different results. Here, we would use former cohort study data to simulate various scenarios of missing data, to figure out the impact of missing data and an appropriate way to corrected the bias under different situation.Our study would help researchers to find the appropriate way to adjust missing data with time-dependent confounders.

数据缺失是队列研究中普遍存在的现象,并会导致研究结果歪曲、统计工作效率降低。自上世纪70年代起,数据缺失一直是方法学研究的热点和难点。近年来,研究者们提出队列研究中另一个研究热点,即依时混杂偏倚,并提出使用边际结构模型控制该偏倚。但是,当研究中数据缺失与依时混杂偏倚同时存在时,如何处理还没有明确定论。我们前期的研究工作发现:采用不同数据填补方法,应用边际结构模型校正依时混杂偏倚得出的分析结果有差异,但差异产生原因还未可知。为探索数据缺失对依时混杂偏倚校正的影响,课题组拟开展以下两部分研究:1. 应用既有队列研究数据,模拟不同缺失机制、缺失比例情境,观察数据缺失对研究结果的影响;2. 分别采用末次结转法、多重填补法和权重调整法,对模拟数据进行填补,探索依时混杂偏倚存在时,各种数据缺失处理方法的适用条件。本研究将有助于研究者明确依时混杂因素存在缺失数据时的处理方法和原则,以得到无偏的研究结果。

项目摘要

数据缺失是队列研究中普遍存在的现象,缺失数据的存在会导致研究结果歪曲、统计工作效率降低,缺失数据相关研究一直是方法学研究的热点和难点。近年来,真实世界研究成为研究热点,但是真实世界研究中存在的混杂因素校正是热点问题中的难点。本课题组一直关注依时混杂因素校正相关研究,前期研究文献检索时发现,当依时混杂因素数据存在缺失时,缺失率多大需要进行校正、如何进行校正还处于探索阶段。因此,本研究基于已有队列研究数据,整理成为完整数据集,并基于完整数据集,分别模拟生成完全随机缺失(Missing Completely at random,MCAR)、随机缺失(Missing at random,MAR)、非随机缺失(Missing not at random,MNAR)三种缺失机制下、缺失率5% 到 40%的模拟数据集,每种缺失机制每种缺失率数据模拟100次,观测不同缺失机制不同缺失率对参数估计的绝对偏倚和相对偏倚;并分别采用末次结转法(Last observation carried forward,LOCF)、多重填补法(Multiple imputation,MI)以及逆概率权重法(Inverse probability weighting,IPW)对模拟的缺失数据集进行填补,比较不同缺失机制、不同缺失率下不同填补方法的填补正确率。研究结果显示,完全随机缺失机制下,不同缺失率参数估计的绝对偏倚和相对偏倚均较小,随机缺失缺失率在20%以上、非随机缺失缺失率在15%以上时,参数估计的相对偏倚较大,建议采用数据填补方法对缺失数据进行填补。同时,比较了三种数据填补方法在随机缺失和非随机缺失机制下的填补正确率,结果显示,多重填补和逆概率权重法填补正确率高于末次结转法。本研究对不同缺失机制下不同缺失率对依时混杂偏倚校正效果影响及不同填补方法填补效果影响研究,将为存在缺失的依时混杂偏倚因素的处理提供有力参考依据,研究者可以通过对缺失数据填补方法的恰当选择,有效控制研究中的为依时混杂偏倚,做出正确的因果推断。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
3

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020
4

湖北某地新生儿神经管畸形的病例对照研究

湖北某地新生儿神经管畸形的病例对照研究

DOI:
发表时间:2019
5

学术型创业企业发展路径探讨

学术型创业企业发展路径探讨

DOI:10.3969/j.issn.1002-5863.2016.15.045
发表时间:2016

刘慧鑫的其他基金

相似国自然基金

1

空间混杂偏倚控制的倾向指数法研究

批准号:81773549
批准年份:2017
负责人:蒋红卫
学科分类:H3011
资助金额:60.00
项目类别:面上项目
2

混杂时滞奇异系统的变结构控制研究及应用

批准号:61074037
批准年份:2010
负责人:马树萍
学科分类:F0301
资助金额:34.00
项目类别:面上项目
3

依时依空环境中分枝过程的极限问题

批准号:11026088
批准年份:2010
负责人:王伟刚
学科分类:A0209
资助金额:3.00
项目类别:数学天元基金项目
4

体外循环心内直视手术时各项参数预测,控制及数据处理

批准号:38770750
批准年份:1987
负责人:徐守春
学科分类:H0210
资助金额:3.00
项目类别:面上项目