High-dimensional data analysis and modeling are hot topics in modern statistics and related fields. This project proposes the shrinkage estimations and likelihood inference for high-dimensional statistical analysis. For the former, motivated by Stein’s unbiased risk estimate (SURE) and empirical Bayes, we will develop a class of novel and innovative shrinkage estimators for high-dimensional mean vector in the heteroscedastic hierarchical normal models with the dependence structure, covariates, sparse and many general error criteria. The optimality properties of these estimators will be carefully studied. For the latter, the project combines the penalized methods, empirical likelihood, and jackknife methods, and introduces the penalized jackknife empirical likelihood methods for the high-dimensional data analysis. It will focus on the study of variable selection and statistical inference problems based on the U-statistics structure estimation equations, canonical correlation analysis, Z-estimate and the general relative error criterion. Again, the project will carefully investigate the asymptotic properties of these methods. Meanwhile, to illustrate the advantages of these methods, we will conduct extensive simulation studies and apply these methods to some real data sets such as image processing, medical science, and compressed sensing. In conclusion, the project will be expected to not only have broaden impact on the theory of SURE, empirical Bayes and empirical likelihood, but also provide more robust, more accurate, less computationally intensive methods to scientific fields such as image processing and bioinformatics.
高维数据分析与建模是目前统计及相关领域研究的热点。本项目拟结合收缩估计和似然推断两方面研究高维数据的统计分析。对于前者,我们将基于Stein无偏风险估计 (SURE) 与经验贝叶斯的思想,构建异方差多元正态模型在分量相依、存在协变量、稀疏以及非均方误差准则下高维均值向量的收缩估计,在一定条件下获得估计的最优性和渐近性质;对于后者,本项目将综合应用惩罚经验似然与刀切法,提出高维惩罚刀切经验似然法,研究基于U-统计量结构估计方程、典型相关分析、Z-估计和广义相对误差准则下的变量选择和推断问题,将证明所提方法的极限性质。同时,本项目将通过模拟研究对这些方法与已有方法进行比较,以展现所提方法的优势。这些新方法将被应用于分析一些图像、医学、压缩传感的实际数据。通过本项目研究,可望在理论上丰富SURE、经验贝叶斯和经验似然的研究,同时也拓宽其应用领域,为图像处理、生物信息等领域提供更稳健、有效的方法。
高维数据的统计分析在生物、经济、环境等领域有着广泛的应用背景。本项目基于经验贝叶斯、Stein无偏风险估计、经验似然等方法,对高维数据中的同时估计与统计推断问题展开了方法论的研究。我们研究了:异质(异源)一维正态总体的均值的大规模同时估计,在方差不同且未知的情形下,提出了双收缩SURE估计;具有一般协方差结构的异质多维正态总体,建立了均值向量的同时估计;高维数据的聚类问题,提出了基于收缩估计和学习向量量化算法的增强K均值聚类法;结合SURE估计与线性分类器,提出了更准确的高维分类算法;异质Pareto总体中参数的同时估计,建立了风险参数的同时估计;广义相对误差估计理论,构建了乘法回归模型中增维参数的经验似然置信区间;构造了线性回归模型中误差项方差的刀切经验似然置信区间;Lorenz占优的检验问题,提出了Lorenz曲线差值的刀切经验似然推断方法;构建了高维数据情形下,非光滑U-型估计函数中参数的置信区间;基于U-型估计方程的变量选择和估计问题,提出了惩罚刀切经验似然方法;考虑了选择后推断问题,建立了基于惩罚经验似然的选择后推断方法。对以上估计和检验,我们证明了相应的渐近性质,进行了大量的模拟研究并应用于一些医学研究、环境、保险等领域实际数据的分析。这些方法是对经验贝叶斯、收缩估计理论和经验似然方法的丰富和发展,也为生物、医学、金融、经济等领域的科学研究和实际应用提供了可靠的方法支持和理论指导。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
高维参数和半参数模型下的似然推断
基于惩罚似然和经验似然方法的高维数据假设检验问题研究
缺失数据下基于经验似然的稳健推断函数
混合模型的似然推断