随着现代科学和计算机技术的飞速发展,高维数据出现在了诸多新兴领域中。然而当维数升高时,经典统计量的极限分布不能很好地描述统计量的真实(或近似)极限性状,或者经典理论完全失效(统计量趋于无穷)。我们的工作是将高维随机矩阵谱理论应用于高维数据统计分析问题,对经典的似然比检验作出必要而有效的修正,和经典多元统计方法以及其他一些高维数据分析方法相比较,得到更为有效的不依赖正态总体分布的检验方法。通过模拟试验,我们可以验证这一论述。我们主要考虑的问题包括高维数据的回归分析和典则相关分析等。同时,还将相关的研究理论应用关于生物医药统计和无线通讯信号网络等实际当中。
我们研究的主要内容是探讨了当前十分热门的大维数据分析问题,创新之处是将高维随机矩阵谱理论应用于大维数据统计分析问题,对经典的似然比检验作出必要而有效的修正,和经典多元统计方法以及其他一些高维数据分析方法相比较,得到更为有效的不依赖正态总体分布的检验方法。通过大维随机矩阵线性谱统计量的中心极限定理,考虑了在样本量和数据维数成比例增长的前提下的线性回归分析、独立性检验、方差检验以及多重相关分析等问题。其中多重相关分析和回归分析等问题,不能直接依赖现有的大维随机矩阵线性谱统计量的中心极限定理,我们通过利用Stieljes变换等手法,在原有的基础上推导出适用的理论工具,从而得出新的有效的检验方法。当维数升高时,经典统计量的极限分布不能很好地描述统计量的真实(或近似)极限性状,或者经典理论完全失效(统计量趋于无穷),而新的理论方法能够弥补这一缺陷,避免经典多元统计分析方法在处理大维数据时出现的严重偏差甚至完全失效的怪异现象。虽然项目的研究成果是基于样本量和数据维数成比例增长的大维假设,但是理论结果却能够兼顾高维和低维数据的不同情形,对于维数具有一定的稳健性,通过模拟实验我们可以看到新的检验办法在实际应用有效可行。在现代科学和计算机技术的飞速发展的背景下,大维数据分析在生物、医药、无线电通讯等领域中都有着广泛的应用,因此,研究结果具有一定的实际意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于随机矩阵理论的高维协方差矩阵的统计推断
随机矩阵/数组形式高维数据的充分降维:统计理论、方法及其应用
长记忆随机场及高维数据模型的统计分析
基于高维随机矩阵的大规模MIMO系统理论及算法研究