Ensemble approaches have attracted much attention recently. An procedure is named "ensemble estimation" if it could incorporate information from multiple candidate models, and meanwhile the resulting estimator enjoys some nice statistical properties (consistency, local efficiency, etc) as long as one of the candidate models is correctly specified. In this project, we would establish a new multipe-model-fusion system based on a novelly designed model refitting procedure which treats model fits as pseudo predictors. We would also design a new family of weighting procedures based on the refitting coefficient values, and explore in detail the corresponding theoretical results for using the different weighting procedure. For illustraional purposes, we would formulate the background, original motivation, implementation and theoretical results of the new model fusion framework using the setup of estimating a population mean in the presence of missing responses and fully observed auxiliary information. Previous theoretical and numerical exploring suggests that: the new model fusion system could be successfully used to the estimation of avearge treatment effect, mean regression models in the presence of monotone missing data, longitudinal data analysis, and ROC curve estimation in the presence of verification bias.
集成估计(ensemble estimation)是近些年来统计研究的一个热点。称一种估计为集成估计,如果它能同时融合多个工作模型信息,且只要其中一个模型正确,所得估计量就具有某种统计优良性(相合性、局部有效性等)。本课题中,我们拟建立一套基于最小二乘再拟合(refitting)的多模型融合理论框架。为恰当融合多个工作模型,我们拟设计一族基于再拟合回归系数的模型融合权重向量,并深入探索不同权重选择对应模型融合结果的渐近理论。我们拟以“响应变量随机缺失、辅助变量完全观测时总体均值估计”为应用情景,详细论述拟设计模型融合系统的产生背景、原始想法、使用过程、及理论分析。前期理论探索和数值分析表明,本课题拟建立的再拟合模型融合理论,预计可成功应用于:平均治疗效应,含单调缺失数据的回归模型、纵向数据模型,存在核实偏差(verification bias)的ROC曲线回归等。
项目研究背景来自两个方面:(1)缺失数据的多稳健估计研究;(2)气象预报的多模式融合研究。(1)含缺失数据的多稳健推断近十余年来受到了越来越多研究人员的关注。称一种统计方法是多稳健的,如果该方法同时满足两条性质:一是能同时融合多个备选工作模型信息;二是只要备选工作模型包含正确模型就能给出统计上合理(相合性、渐近正态性、渐近有效性)的估计结果。由于这种多重保障功能,因此无论从应用还是理论角度,多稳健性都是一个有重要意义的研究对象。受2010前后QIN Jing、CHAN Gary和HAN Peisong等研究工作的启发,项目负责人提出并建立一套基于最小二乘再拟合(refitting)的多模型融合理论框架, 探索其在缺失数据分析中的应用。(2)气象预报领域一个重要的问题是“多模式预报的融合问题”(集合预报)。具体地,已知K个机构(比如中国气象局、美国气象局、日本气象厅、欧洲气象局)对t时期某地域降雨量y_t的预报值,问题是如何把K个机构的预报整合成一个预报值?一种流行的处理方法是贝叶斯模型平均(BMA);申请人2016年在北师大理科学报上综述了BMA方面的研究进展。此后,一直尝试思考多模式融合的其它处理方式。项目提出的最小二乘再拟合为多模式融合提供了潜在路径。..研究内容:(1)项目负责人同其合作者基于最小二乘再拟合想法和经验似然,探索了含缺失因变量回归模型的多稳健估计问题,研究了多模式融合的权重设置问题,借助含讨厌参数的估计函数理论证明了估计量的渐近性质。(2)项目负责人同其合作者系统研究了存在外源子群体t年生存率信息时,基于经验似然的加法危险率模型统计推断问题。(3)项目负责人同其合作者通过自发收集散布于网络的新冠患者个案数据,借助区间删失模型理论,使用常用生存分布模型,对比研究了新冠肺炎的潜伏期分布问题。..重要结果:项目组搭建了基于最小二乘再拟合的多模型融合框架。在含辅助变量的因变量随机缺失总体均值估计问题中,深入探索了多模型融合问题的权重与最小二乘再拟合系数的关系。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
混合效应模型的广义推断理论及其应用
多模态数据融合理论及应用研究
针对多模型实例数据的鲁棒模型拟合及其在运动分割中的应用
基于异构融合与标注拟合的多层次自治指纹地图的研究与应用