The multi-response regression model is one of the classical models in statistics, it is widely applied in different disciplines. Currently, research on this model under the high-dimensional situation is rare and requires more attention. This project concerns about the statistical inference problems in this model when the dimensions of both the covariates and responses are much larger than the sample size. Under the assumption that the error term follows a multivariate normal distribution, we will consider the following three problems. Firstly, we infer on whether a particular element of the precision matrix of the error term is zero or not, by which we can determine the existence of conditional correlations among the responses. Secondly, we conduct parameter estimation on this matrix. Thirdly, we focus on the inference of the coefficient matrix, such as to identify its sparse pattern and to conduct parameter estimation.
含多个因变量的线性回归模型是统计学中的经典模型之一,其应用广泛存在于各个学科中。目前国内外对高维数据情形下的该模型的研究比较欠缺。本项目研究该模型在自变量和因变量维数都远大于样本量的情形下的统计推断问题。在误差项服从多元正态分布的假设下,我们考虑以下三个问题:一是判断误差项的精度矩阵中各元素是否为零,从而定性地描述因变量之间的条件相关性;二是对误差项的精度矩阵进行参数估计;三是对系数矩阵进行统计推断,还原其稀疏结构,并进行参数估计。
该项目主要研究多因变量多元线性回归模型中的统计推断问题,在资助项目执行过程中,我围绕该项目对相关的几个科研问题进行了深入探讨。.在该模型的框架下,在常见模型假设下,我和我的合作者提出了多元OMP算法;当自变量和因变量具备一些成组结构时,我们提出了基于典型相关系数的序贯特征选择方法;多类判别分析中涉及到当自变量和因变量均有误差时该模型的参数估计问题,我们研究了该估计过程对多类判别分析错判率的影响。另外,针对自变量观测矩阵可能被污染、自变量与因变量间不是线性依赖关系等现象提出更稳健的参数估计方法,并尝试通过控制大规模假设检验中的错误发现率来实现变量选择。对以上几个问题,我们均进行了大量的数值模拟计算和实例数据分析,并进行了理论性质的探讨。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于LASSO-SVMR模型城市生活需水量的预测
基于门限自回归模型的高维相依计数数据的统计推断
高维回归模型的大规模统计学习和推断
高维纵向数据分位数回归中的统计推断研究
高维数据的图模型学习与统计推断