The project mainly apply oneself the study of semiparametric regression modeling and statistics analysis for high dimension data. The study contents include the following five aspects. First, the adaptive estimation methods for the semiparametric regression models with high dimensional data are developed, and the new estimation methods to avoid the effect brought by infinite dimensional parametric estimation and dada dimension number are proposed, so that the constructed estimators are adaptability and robustness. Second, the variable selection methods for the semiparametric regression models with superhigh dimensional data are proposed, and the variable selection procedures and corresponding robust algorithms of the data adaptability are designed. Third, the approaches of statistical inference for the interactive model with single-response variable and additive model with multi-response are explored, the main study include: the model spline fitting estimation, model selection and check, model bias calculation, consistency and its convergence rate and so on. Fourth, the low dimension nonlinear approximation model and fast algorithm for high dimensional linear issues are studied, and the dimension-reduced new method for the high dimensional data are developed. Fifth,the statistical softwares for the basal algorithm of high performance calculation are empoldered, the algorithm of the nonlinear approximation and the sparseness expression for high dimension data are actualized, and the obtained theory and method are used to analysis the engineering data. The project is a hot study hotspot in statistics, and the research results have expansive application foreground in many fields such as biomedicine, information management, finance engineering, econometrics, quality control and so on.
本项目主要致力于高维数据的半参数回归建模和统计分析的研究,其研究内容包括下列五个方面。第一,发展高维数据半参数回归模型的自适应估计方法,提出新的估计方法来消除无限维讨厌参数估计和数据维数的影响,使构造的估计具有自适应性和稳健性。第二,提出超高维数据的半参数回归模型的变量选择方法,设计数据自适应变量选择程序和相应的稳健算法。第三,探讨单响应变量交互模型和多响应变量可加模型统计推断的途径,主要研究模型样条拟合估计、模型选择与检验、模型偏差计算、相合性及其收敛速度等。第四,研究高维线性问题的低维非线性逼近模式与快速算法,发展高维数据降维的新方法。第五,开发高性能计算的基础算法的统计软件包,实现高维数据的非线性逼近和稀疏表示算法,将所得到的理论和方法应用于工程数据的分析之中。该项目是统计学的热点研究课题之一,其研究成果在生物医学、信息管理、金融工程、计量经济、质量控制等领域有着广阔的应用前景。
高维数据的统计分析与建模是统计学的重要研究课题之一。本项目主要致力于用半参数回归模型对高维数据进行统计分析,其主要研究成果有一下几方面:第一,研究了缺失响应变量下单指标模型的统计推断,发展了一种纠偏方法来估计指标系数,提出了两种加权的经验对数似然比统计量,其渐近分布是标准卡的,由此可以构造指标系数的经验似然置信域;第二,提出了一种嵌套的修正Cholesky分解方法来对多元纵向数据的协方差结构进行建模,发展了一种Fisher得分算法来计算回归系数的极大似然估计,建立了估计量的相合性和渐近正态性;第三,研究了纵向数据下部分线性模型的经验似然推断问题,提出了一种广义经验似然方法来构造回归系数和基准函数的经验似然比统计量,得到了此统计量的渐近分布的非参数Wilk定理,由此构造了相应参数的置信区间;第四,研究了稀疏超高维部分线性变系数模型中兴趣参数的变量选择和估计问题,提出了一种非凸惩罚估计,证明了它的oracle性质,并解决了调整参数的自适应选择问题;第五,研究了部分线性函数可加模型的变量选择问题,提出了一种变量选择方法,建立了所构造地方估计量的渐近理论。本课题的研究成果丰富和发展了高维数据的统计分析方法,从而为生物医学、计量经济学、环境科学、社会科学以及公共卫生和健康等领域的研究提供科学的理论依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于变系数半参数模型的高维数据统计分析
不完全数据半参数回归模型的统计分析及其应用
基于高维稀疏复杂数据的半参数变换模型结构的统计分析
含方向变量的高维数据的多元非参数回归建模及降维研究