Sensitivity analysis for non-ignorable missing data is one hot topic in missing data area; in regression analysis, research of missing covariate problem is crucial for robust estimation of regression coefficient. However, the uncertainty of missing data mechanisms and robustness of parameter estimations are two main difficulties to overcome currently, which cause bias towards the estimation of regression coefficient. This project aims to achieve most plausible estimation of parameter of interest through bias analysis, to learn the robustness of parameters and to explore the characterization of key sensitivity parameters, and through simulation-based method to evaluate the choice of values of sensitivity parameters. Firstly, parameter of interest will be estimated through MLE based on a semi-parametric missing data mechanism. Secondly, model uncertainty analysis and bias analysis will be introduced to investigate the robustness of parameter estimation, to explore the key sensitive factors/parameters and their correlations with parameter of interest. Next, based on the theory of simulation-based sensitivity analysis for non-ignorable missing data and pilot analysis results, sensitivity parameter evaluation will be conducted for non-ignorable missing covariate problem. Then bias will be calculated, and the most plausible estimates will be reported. This project will build a new way in solving parameter sensitivity problem with non-ignorable missing data in regression models.
不可忽略缺失数据敏感性分析是数据缺失的热点领域之一,回归分析中协变量数据缺失研究对回归系数精准估计有着重要意义。现有分析方法难以克服数据缺失模型选择不确定性、参数估计稳健性等问题,导致回归系数的估计出现偏差。本项目拟基于因果偏差分析进行目标参数稳健性评估,探索影响参数估计精度的关键敏感因素,进一步通过模拟计算评估关键敏感因素的取值问题,以此实现对目标参数的最优估计。首先,基于一种半参数数据缺失模型假设对目标参数进行极大似然估计;其次,引入模型不确定性偏差分析方法,对参数稳健性进行评估,分析影响目标参数估计的关键敏感因素,并研究两者关联特性;然后,结合基于模拟计算的不可忽略缺失数据敏感性分析的最新理论基础和预实验结果,对协变量不可忽略缺失数据偏差分析中的敏感参数建立评估机制,进而计算偏差大小,求得目标参数最优估计,为回归分析不可忽略缺失数据的参数估计敏感性问题提供新的解决方案。
数据缺失是数据分析中的重要问题,尤其在医学统计等领域需要更加精准的参数估计,偏差分析显得尤为重要。本课题针对回归模型中不可忽略丢失数据模型敏感性分析开展了相关研究,基于不确定性偏差分析理论,对数据丢失机制的复杂性带来的偏差进行了推演,建立了敏感性分析的相关理论基础。将协变量缺失可能带来的估计偏差进行了分析,并定义了缺失机制偏差和协变量关联偏差,对两者进行了理论推导。进一步对偏差中的重要敏感性参数进行了评估,利用课题负责人前期发表的敏感性分析方法对偏差和敏感性参数进行了评估。设计了大量模拟实验,并结合真实数据实验验证了本方法的可靠性。针对生物医学大数据的数据建模问题进行了探讨和应用,发表了多项相关科研成果。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
不可忽略缺失数据的工具变量方法研究
不可忽略缺失数据分位数回归模型和变量选择方法及其应用
不可忽略缺失数据模型的可识别性和双重稳健估计
不可忽略缺失数据的若干理论研究及其应用