Nonignorable missing data is now attracting increasing attention and becoming an important research topic in the missing data studies. However, identifiability and estimation of parameters with nonignorable missing response data are challenging problems in statistical theory and applications. In this project, we will first address the question about how to overcome the non-identifiability issue by utilizing a nonresponse instrument variable under the exponential tilting model. The double robust and multiply robust estimators will be provided by using generalized method of moments. Second, inference on parameters will be developed by employing resampling calibrated adjusted empirical likelihood and robust adjusted empirical likelihood, with or without auxiliary information. Third, in order to handle the high-dimensional data with nonignorable missing values, variable selection based on SCAD penalty and sufficient dimension reduction methods will be proposed. In addition, the asymptotic properties of the proposed estimators will be investigated, when the dimension is fixed or diverge as the sample size approaches infinity. Finally, we will establish the quickest change detection methods and control charts with regard to nonignorable missing data, and their properties will be studied.
不可忽略缺失数据,作为近几年缺失数据领域里一个理论新颖且具有重要应用价值的问题,广泛存在于科学研究和生产生活的各个领域。由于不可忽略缺失数据的缺失机制与缺失数据本身有关,导致在大多数情况下参数是不可识别的,现有的统计方法无法满足理论研究和实际应用的需要。本项目致力于解决不可忽略缺失数据的难点和热点问题,主要包括:(1)借助工具变量解决指数倾斜模型参数不可识别的问题,建立具有双重稳健性和多重稳健性的估计方法;(2)利用重抽样的高阶调整经验方法建立参数的有效估计,基于空间深度统计量提出稳健的调整经验似然方法;(3)利用带惩罚项的变量选择方法和充分降维方法处理不可忽略缺失的高维数据问题,研究在参数维数固定以及维数随样本量增大时估计方法的理论性质;(4)在不可忽略缺失数据下研究快速变点检测和控制图的应用。四个部分既相互独立,又相互支撑,把理论研究与实际应用紧密联系。
不可忽略缺失数据普遍存在于临床试验、药物研发、流行病学、人口普查等许多事关国计民生的重要领域,该类型数据最大的特点是缺失部分数据总体的条件分布与未缺失部分数据总体的条件分布是完全不同的。本项目主要聚焦于如何有效地处理带有不可忽略缺失的数据,充分利用数据信息,准确反映研究对象的总体特征。基于广义矩和经验似然方法,我们完善工具变量的方法和理论研究,建立不可忽略缺失数据的模型选择和模型平均方法;将现代统计研究的思想和方法融合到不可忽略缺失数据领域,从深度和广度上拓展现有的统计模型和方法;探究带有不可忽略缺失高维数据和纵向数据等复杂数据的统计推断方法和理论性质。受本项目的支持,我们共发表或接收同行审阅的论文20篇(其中SCI论文18篇),包括《Biometrika》(1篇)、《Journal of the American Statistical Association》(1篇)、《Statistica Sinica》(3篇)、《Scandinavian Journal of Statistics》(1篇)和《Journal of Quality Technology》(1篇)等统计学顶级或重要期刊,参与撰写1部统计学著作,自主研发并取得计算机软件著作权1项,成功申请到4项国家自然科学基金项目和1项省部级自然科学基金项目,担任国际统计学SCI期刊《Journal of Nonparametics Statistics》的Associate Editor、中国现场统计研究会生存分析分会副秘书长、美国《Mathematical Reviews》评论员等;先后受邀于美国芝加哥及麦迪逊、加拿大滑铁卢大学、中国人民大学、厦门大学、首都师范大学等单位参加学术会议或作学术报告20余次。本项目提出的方法已实际广泛应用于公共健康(胆固醇含量与心脏疾病数据等)、临床试验(ACTG 175和ACTG 193A数据)、流行病学(HIV-CD4数据)、政府统计(劳动收入面板数据)等多个与国民生活和生产息息相关的研究领域中。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于MCPF算法的列车组合定位应用研究
二维FM系统的同时故障检测与控制
城市生活垃圾热值的特征变量选择方法及预测建模
基于“血热理论”探讨清热凉血方调控CD155/TIGIT信号通路抑制T细胞免疫治疗银屑病的分子机制
缺失数据下广义线性模型的经验似然方法
缺失数据下广义线性模型的经验似然和变量选择问题
缺失数据下基于经验似然的稳健推断函数
缺失数据下加速失效时间模型的经验似然推断