基于偏差估计的协变量不可忽略缺失数据敏感性分析研究

基本信息
批准号:11801542
项目类别:青年科学基金项目
资助金额:26.00
负责人:殷鹏
学科分类:
依托单位:中国科学院深圳先进技术研究院
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:苗芬,王莹莹,王如心,艾红,樊小毛,Nguyen Van Sau,闻博
关键词:
广义线性模型偏差分析协变量缺失不可忽略缺失数据敏感性分析
结项摘要

Sensitivity analysis for non-ignorable missing data is one hot topic in missing data area; in regression analysis, research of missing covariate problem is crucial for robust estimation of regression coefficient. However, the uncertainty of missing data mechanisms and robustness of parameter estimations are two main difficulties to overcome currently, which cause bias towards the estimation of regression coefficient. This project aims to achieve most plausible estimation of parameter of interest through bias analysis, to learn the robustness of parameters and to explore the characterization of key sensitivity parameters, and through simulation-based method to evaluate the choice of values of sensitivity parameters. Firstly, parameter of interest will be estimated through MLE based on a semi-parametric missing data mechanism. Secondly, model uncertainty analysis and bias analysis will be introduced to investigate the robustness of parameter estimation, to explore the key sensitive factors/parameters and their correlations with parameter of interest. Next, based on the theory of simulation-based sensitivity analysis for non-ignorable missing data and pilot analysis results, sensitivity parameter evaluation will be conducted for non-ignorable missing covariate problem. Then bias will be calculated, and the most plausible estimates will be reported. This project will build a new way in solving parameter sensitivity problem with non-ignorable missing data in regression models.

不可忽略缺失数据敏感性分析是数据缺失的热点领域之一,回归分析中协变量数据缺失研究对回归系数精准估计有着重要意义。现有分析方法难以克服数据缺失模型选择不确定性、参数估计稳健性等问题,导致回归系数的估计出现偏差。本项目拟基于因果偏差分析进行目标参数稳健性评估,探索影响参数估计精度的关键敏感因素,进一步通过模拟计算评估关键敏感因素的取值问题,以此实现对目标参数的最优估计。首先,基于一种半参数数据缺失模型假设对目标参数进行极大似然估计;其次,引入模型不确定性偏差分析方法,对参数稳健性进行评估,分析影响目标参数估计的关键敏感因素,并研究两者关联特性;然后,结合基于模拟计算的不可忽略缺失数据敏感性分析的最新理论基础和预实验结果,对协变量不可忽略缺失数据偏差分析中的敏感参数建立评估机制,进而计算偏差大小,求得目标参数最优估计,为回归分析不可忽略缺失数据的参数估计敏感性问题提供新的解决方案。

项目摘要

数据缺失是数据分析中的重要问题,尤其在医学统计等领域需要更加精准的参数估计,偏差分析显得尤为重要。本课题针对回归模型中不可忽略丢失数据模型敏感性分析开展了相关研究,基于不确定性偏差分析理论,对数据丢失机制的复杂性带来的偏差进行了推演,建立了敏感性分析的相关理论基础。将协变量缺失可能带来的估计偏差进行了分析,并定义了缺失机制偏差和协变量关联偏差,对两者进行了理论推导。进一步对偏差中的重要敏感性参数进行了评估,利用课题负责人前期发表的敏感性分析方法对偏差和敏感性参数进行了评估。设计了大量模拟实验,并结合真实数据实验验证了本方法的可靠性。针对生物医学大数据的数据建模问题进行了探讨和应用,发表了多项相关科研成果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

相似国自然基金

1

不可忽略缺失数据的工具变量方法研究

批准号:11601156
批准年份:2016
负责人:方方
学科分类:A0402
资助金额:19.00
项目类别:青年科学基金项目
2

不可忽略缺失数据分位数回归模型和变量选择方法及其应用

批准号:11601424
批准年份:2016
负责人:张莉
学科分类:A0403
资助金额:19.00
项目类别:青年科学基金项目
3

不可忽略缺失数据模型的可识别性和双重稳健估计

批准号:11871173
批准年份:2018
负责人:崔霞
学科分类:A0403
资助金额:55.00
项目类别:面上项目
4

不可忽略缺失数据的若干理论研究及其应用

批准号:11871287
批准年份:2018
负责人:王磊
学科分类:A0402
资助金额:52.00
项目类别:面上项目