In the era of big data, the classical theory and statistical methods of mathematical statistics are no longer applicable for the large dimensional data, due to the explosive growth of data. It is necessary to develop a powerful theoretical tool to deal with the statistical analysis of large dimensional data. The development of spectral theory of large dimensional random matrices makes it possible to solve the above issues. It is widely applied in various fields such as information, finance, medicine, biology, psychology and government services. However, the tests in large dimensional principal component analysis and factor analysis are rarely mentioned in the articles, and such problems have important applications in signal processing, economic data analysis and psychology, etc. Therefore, this project derives CLT for Linear Spectral Statistics of a part of eigenvalues of large dimensional sample covariance matrix by using the spectral theory of large dimensional random matrices. Based on this, the new methods for the tests of large dimensional principal component analysis and factor analysis are provided, and applied into practical problems in various fields, thus broadening the scope of application of large dimensional random matrix theory in the large dimensional data analysis.
在大数据时代,由于数据爆炸式的增长,经典数理统计中的理论结果和统计方法不再适用,急需一套有力的理论工具来处理大维数据的统计分析问题。大维随机矩阵谱理论的发展为解决相关问题提供了理论支持,并被广泛应用于信息、金融、医学、生物、心理学以及政府服务等各个领域。但是,关于大维主成分分析和因子分析的检验的问题,还鲜有文章涉及,而这类问题在信号处理、经济数据分析以及心理学等方面都有重要应用。因此,本项目运用大维随机矩阵谱理论,推导大维样本协方差矩阵的部分特征值的线性谱统计量的中心极限定理,并以此为理论工具提出大维总体主成分的个数的检验方法以及大维因子分析中模型拟合的检验方法,并将其应用于各领域中的实际问题,从而拓宽大维随机矩阵理论在大维数据分析中的应用范围,使之拥有更广阔的应用前景。
在大数据时代,由于数据爆炸式的增,经典数理统计中的理论结果和统计方法不再适用,急需一套有效的理论工具来处理大维数据的统计分析问题。大维随机矩阵谱理论的发展为解决相关问题提供理论支持,并被广泛应用于信息、金融、医学、生物、心理学以及政府服务等各个领域。但是,立项之初关于大维主成分分析和因子分析的检验的问题,还鲜有文章涉及。因此,本项目立项初衷是为了研究大维海量数据的主成分分析和因子分析。考虑当维数p和样本量n成比例趋于无穷时,利用大维随机矩阵的谱理论提出大维总体主成分的个数的检验方法以及大维因子分析中模型拟合的检验方法。我们主要考虑的两个检验问题是:大维总体主成分的个数的检验以及大维因子分析中模型拟合的检验。根据主成分分析和因子分析的性质,相当于将原来数据的信息主要体现在一部分主要影响的因子上,即主成分(或起主要作用的因子)。这样其对应的方差就具有一定的特殊结构,比如部分特征值明显不同于其他。因此,我们或通过检验其方差结构的特殊性,以此来确定明显不同于其他的特征值的个数,就可以相应的确定主成分或者因子的个数;或通过大维数据的变量选择方法,如大维情况下的AIC、BIC等来解决相应的问题。相关研究形成SCI论文共11篇,并获得1项省级科研奖励。这类问题在无线通讯和金融等各个领域中都有所应用。我们在论文中也初浅提到一些相关应用,未来希望可能致力于相关理论研究在无线通讯领域中的应用推广,以问题为导向在应用中进一步推进理论研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于SSVEP 直接脑控机器人方向和速度研究
分枝移民过程的极限定理及其应用
广义次序统计量的极限理论及其应用
应用概率领域中的极限定理
高维样本自协方差矩阵的极限定理及其应用