The project mainly studies hypothesis testing of the correlation structures of high dimensional random vectors. The study mainly includes: .(1).Hypothesis testing of the non-Pearson correlation structures of random vectors under the circumstance when the parameter dimension p is large and the sample sizes n is small..(2).Hypothesis testing of the correlation structures of random vectors under various norms of matrix..(3).Hypothesis testing of the correlation structures of Ornstein-Uhlenbeck process and Ornstein-Uhlenbeck process driven by Levy-process. .(4).Hypothesis testing of the correlation structures of space-time for stochastic processes model and time series model, simultaneously..The hypothesis testing of the correlation structures of random vectors is a basic problem of multivariate statistical analysis, perfect result has been obtained when p is small and n is large. But in the current era of big data, we are confronted with many problems when p is large and n is small, the traditional likelihood ratio test method is no longer feasible. The object of this project is to modify the traditional statistical testing methods and propose a new method so that it can be applied to data analysis in the era of big data. In the meantime, the project will bring innovations of statistical methods and statistical instruments during the study.
该项目主要研究高维随机向量的相关结构的检验问题。研究的主要内容是:(1)在参数维数p大,样本容量n小的情形下研究随机向量的非Pearson相关关系的检验问题(2)在不同矩阵范数度量下,考虑对两样本高维随机向量的相关结构的检验问题(3)对Ornstein-Uhlenbeck过程和由Levy过程驱动的Ornstein-Uhlenbeck过程研究其相关结构的检验问题(4)对高维随机过程模型或时间序列模型考虑同时检验时间和空间的相关结构。对于随机向量的相关结构的检验问题是多元分析的一个基本问题,在小p,大n的情形下,已取得完美的结果。但在当前的大数据时代,小n,大p的问题比比皆是,传统的似然比检验的方法已不再可行。该课题的目的就是将传统的统计检验问题与方法更新改造,并且创新,使之能够用于大数据时代的数据分析。同时,该课题在研究过程中也会带来统计方法与统计工具等方面的创新。
本项目研究高维随机向量相关结构的检验问题,取得如下研究结果:. (1)关于高维数据的相关性检验: .(a)提出了检验高维 U 统计量矩阵的统一框架。这一框架可以处理多种基于秩的相关矩阵。将其应用于 Kendall 的 tau矩阵的检验,证明了方法的最优性。(b) 提出了一种数据自适应检验,它能够对备择假设无论是稠密还是稀疏情形下均具有很好的功效。 利用乘子自举法得到了检验统计量的近似极限分布,讨论了包括渐近性和检验功效等理论性质。. (2) 讨论了平稳随机过程分位数- 耦合交叉协方差函数的一些基本性质; 基于离散抽样, 给出了分位数- 耦合交叉协方差函数的估计量, 并证明了其相合性; 并将估计方法应用于船体振动序列自相依性质分析, 为船体振动模型选择提供借鉴.. (3) 讨论高维数据变的检验问题,(a) 对于时间序列数据,我们构建了一个新的检验统计量族,并将它们结合起来以适应不同总体分布的尾部。 由于最终的检验统计量很复杂,因此我们设计了一种低成本自助法来近似其极限分布。(b) 对于存在协变量阈值参数的高维单指标门限回归模型. 提出基于l1范数惩罚方法来估计回归系数和阈值参数, 并且提出一种近端梯度算法来检测可能存在的变点. 在一定的稀疏条件下, 得到回归系数估计量l1 范数下估计误差和预测误差的非渐近Oracle 不等式..(4)高维具有相关结构为Gauss Copula 等相关模型的研究, (a) 提出了恢复Gauss 关联结构(copula) 图模型的充分降维方法, 该方法在超高维情形下具有很高的计算效率.(b)研究了高维高斯copula回归模型的变量选择问题。我们将变量选择问题转化为多重检验问题,避免了正则化参数与错误发现的变量数或停止规则的决定之间的模棱两可的关系。 (c)我们提出了一种灵活的半参数回归模型,称为椭圆Copula回归(ECR)模型,ECR模型可以捕获变量之间的重尾特征和尾部相关性。对ECR模型,我们提出了一种稳健的变量选择方法。.(5)我们在椭球因子模型(EFM)框架下,提出了一种有效且稳健估计其因子个数的方法。 证明了当横截面N和时间维度T都为无穷大时,所提出的估计量是一致的。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于分形维数和支持向量机的串联电弧故障诊断方法
高维数据下多样本均值检验问题的研究
高维数据检验问题中的稀疏方法及其应用
高维半参数模型假设检验问题的研究
基于充分降维方法的高维数据假设检验问题的研究