高维复杂结构数据降维

基本信息
批准号:11471030
项目类别:面上项目
资助金额:60.00
负责人:赵俊龙
学科分类:
依托单位:北京师范大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:徐兴忠,刘旭华,赵俊光,黄乐乐,张莹,詹书仕
关键词:
矩阵(张量)数据稳健统计变量选择协方差矩阵高维数据分析
结项摘要

With the development of technology, it is increasingly common to model the high dimensional data of complex structure. Modeling the matrix (tensor) valued data is commonly encountered in the field of medicine and biology. Although there are many theories and methods developed to deal with the high dimensional vector-valued data, vectorizing the matrix (tensor) data into vector simply and applying the existing methods for vector valued data will destroy the inner structure of the data and induce too many redundent paprameters, leading to unstable estimate. Compared with vector-valued case, parameters in the statistical model of matrix(tensor) data usally have more complicated structure. And the researches are less developed for many cases. This project will develop dimension reduction and varaible selection techniques for the high dimensional matrix(tensor) data of complex structure. It contains three parts. (1) Parameter estimation and hypothesis testing in the regression model of high dimensional matrix (tensor) valued data. (2)Robust statistical methods for high dimensional matrix(tensor) valued data. (3) The covariance and precision matrix estimate for high dimensional matrix(tensor) valued data. This project has great academic values and promising future in application.

随着技术进步,高维复杂结构数据的建模已经越来越普遍。在生物、医学等领域中经常需要对矩阵(张量)值(即变量取值为矩阵或张量)高维数据建模。尽管向量值(即变量的取值为向量)高维数据已有许多降维和变量选择方法,但是简单将矩阵(张量)值数据拉直为向量,并使用已有的向量值数据统计方法,将破坏数据的行列结构,导致参数维数过高,估计不稳定。和向量值数据相比,高维矩阵(张量)值数据建模中,参数往往具有更复杂的结构,而许多情形的研究还很不充分。本项目将研究具有复杂结构的高维矩阵(张量)数据的降维和变量选择方法,主要包括三个内容:(1)高维矩阵(张量)值数据回归模型中的参数估计和假设检验。(2)高维矩阵(张量)值数据的稳健统计方法。(3)高维矩阵(张量)值变量的协方差及其逆矩阵的估计。本项研究具有很高的学术价值和很强的应用价值。

项目摘要

随着信息技术的发展,在生物、医学等领域中经常需要对矩阵(张量)值高维数据建模。与传统向量数据不同,矩阵(张量)数据具有行列结构信息。建模过程中简单将数据拉直成向量会丢失行列结构信息并造成变量维数过高。本项目研究复杂结构高维矩阵(张量)数据的建模问题,主要包括三个内容:(1)高维矩阵值数据回归模型的参数估计以及影响点诊断;(2)高维矩阵值数据协方差及其逆矩阵的稳健统计;(3)高维数据若干假设检验问题。 . 本项目研究了矩阵值数据迹回归模型中,参数的估计和变量选择问题。通过将核范数和group lasso惩罚相结合,建立了凸的目标函数,得到了估计的相合性。在实际问题中,异常值或影响点是十分常见的。 当有多个影响点时,由于masking效应和swamping效应的存在,模型诊断是一个困难的问题。我们提出了影响点诊断的新方法MIP,有效克服了masking和swamping效应。 此外,我们研究了分类问题的有限样本崩溃点问题,通过研究发现,经典的有限样本崩溃点的概念并不适应于分类问题,我们提出了角度崩溃点的概念,并给出了线性和kernel分类器下崩溃点的上界。. 本项目研究了高维矩阵值数据协方差矩阵的稳健估计问题。针对协方差矩阵具有非稀疏Kronecker乘积和结构。我们基于Kendall's 相关系数提出了协方差矩阵的稳健估计。其次针对相关系数矩阵具有稀疏Kronecker结构的情形,我们用类似方法,建立了相关系数的稳健估计,该估计在维数增加时具有更快的收敛速度。此外,针对高维因子模型中因子载荷矩阵具有稀疏行结构的情形,我们提出了一种新的估计方法,将协方差矩阵分为稀疏稠密子块分别处理,所得估计具有更高的收敛速度。. 本项目还研究了高维正态总体的若干假设检验问题。研究了协方差具有spike结构下两正态总体均值的估计问题。研究了K个具有相同协方差矩阵的正态总体,均值是否相等的检验问题。研究了高维正态线性模型系数是否为零的假设检验问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

赵俊龙的其他基金

批准号:31872463
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:30972175
批准年份:2009
资助金额:35.00
项目类别:面上项目
批准号:11026049
批准年份:2010
资助金额:3.00
项目类别:数学天元基金项目
批准号:31372429
批准年份:2013
资助金额:85.00
项目类别:面上项目
批准号:41802181
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:81802841
批准年份:2018
资助金额:22.00
项目类别:青年科学基金项目
批准号:30070572
批准年份:2000
资助金额:15.00
项目类别:面上项目
批准号:11871104
批准年份:2018
资助金额:52.00
项目类别:面上项目
批准号:11101022
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:30671575
批准年份:2006
资助金额:28.00
项目类别:面上项目

相似国自然基金

1

高维数据保真降维方法研究

批准号:61471182
批准年份:2014
负责人:祁云嵩
学科分类:F0113
资助金额:75.00
项目类别:面上项目
2

多视野高维复杂数据融合降维方法与理论研究

批准号:91230112
批准年份:2012
负责人:张振跃
学科分类:A0502
资助金额:65.00
项目类别:重大研究计划
3

基于语义计算的高维复杂数据降维理论与实证研究

批准号:71171148
批准年份:2011
负责人:向阳
学科分类:G0104
资助金额:42.00
项目类别:面上项目
4

超高维复杂数据统计降维研究

批准号:11771215
批准年份:2017
负责人:来鹏
学科分类:A0402
资助金额:48.00
项目类别:面上项目