With the development of science and technology, the collection and analysis of high dimensional data has become a hot topic in the field of science. Testing the equality of two covariance matrices is a very important issue in multivariate statistics, but the emergence of high dimensional data makes classical statistical methods no longer applicable. In this project, we intend to propose a thresholding test for the equality of two high dimensional covariance matrices. First, we will use the thresholding value to “filter” out the smaller differences (after normalization) between the two sample covariance matrices, and then use the larger differences to formulate the test statistic and derive its asymptotic distribution under the null hypothesis. It will be shown that the newly proposed test is more powerful than the existing tests based on the Frobenius norm or the maximum difference of the elements when the signal is sparse. Furthermore, the project intends to explore the detection boundary of the testing of equality of two high dimensional covariance matrix. As far as we know, the existing literature have not covered this issue and it belongs to a new research topic. At the same time, we will develop the efficient algorithms and a R package for the new method and explore its application in clinical research.
随着科学技术的发展,高维数据的收集和分析已经成为科学领域的研究热点。两总体协方差矩阵相等检验是多元统计中非常重要的一个问题,但是高维数据的出现使得传统的统计方法不再适用。本项目利用门限的想法,拟提出一种新的检验两高维总体协方差矩阵相等的方法。我们拟利用门限值,首先“过滤”掉两个样本协方差矩阵差异较小(经过标准化之后)的元素,然后用剩下的差异较大的元素构造检验统计量,并研究该统计量的渐近分布。新提出的检验统计量将在信号比较稀疏时比已有的基于Frobenius模或者两样本协方差矩阵元素的最大差异的方法有更好的检验功效。进一步,本项目拟在更一般的情况下,探讨检验高维两总体协方差矩阵相等的探测边界问题,据我们所知,该问题在国际上尚未有相关的研究成果,属于新的研究方向。同时,我们拟发展新提出方法的高效算法和R软件包,并且探索新方法在实际临床研究中的应用。
协方差矩阵是多元统计中的重要组成部分,高维数据的出现使得传统的多元统计方法不再适用。本课题研究了高维两总体协方差矩阵相等检验及其最优性问题。本研究使用了基于阈值的检验方法,考虑在检验过程中过滤掉小的无用的噪音,采用剩下的信号构造检验统计量。由于协方差矩阵的相关性及阈值方法的不连续性,本研究提出了一种新的基于Coupling和鞅中心极限定理相结合的方法推导了新提出统计量的渐近分布。由此,该研究考虑了高维协方差矩阵检验的最优性问题。通过研究检验的探测边界,我们得到了该检验的探测边界,并由此说明了在稀疏弱信号下,新提出的检验统计量相对于已有的基于Frobenius模和基于最大差异统计量的优越性。同时,我们也得到了在该设定下检验的minimax速率。 数值模拟显示了该方法的优势。通过对肺癌患者的基因数据研究,该方法相对于其他方法有更高的检验功效,得到了一些新的有意义的结果。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
特斯拉涡轮机运行性能研究综述
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
基于非正态假设下的高维协方差矩阵检验问题研究
基于投影的高维两样本分布相等的检验方法研究
高维时空过程协方差矩阵的谱分析及其应用
基于随机矩阵理论的高维协方差矩阵的统计推断