高维回归模型中的交互作用识别问题

基本信息
批准号:11701367
项目类别:青年科学基金项目
资助金额:25.00
负责人:王成
学科分类:
依托单位:上海交通大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:王小舟,赵建达,李文涛
关键词:
充分性降维交互作用识别二次回归分析高维数据分析二次判别分析
结项摘要

In the regression model, considering the interactions between the covariates is a natural extension of the linear model. Many real examples show that the interaction between the explanatory variables can help improve the model interpretability and the prediction. In the statistical analysis, there are many classical models involving the interaction, such as quadratic regression and quadratic discriminant analysis. Since the number of the interactions increase quadratically with the data dimension and the interactions have complex covariance structures, it is a challenging problem to deal with interactions for high dimensional data. In this project, we propose to study the the Hessian matrix of the regression function to conduct a sufficient dimension reduction for high dimensional regression model with interactions. The Hessian matrix describes the second order partial derivatives of the regression function and specially for the quadratic regression and the quadratic discriminant analysis, it relates to the regression coefficient matrix with the interactions. By studying the Hessian matrix, we derive the relationship between the regression coefficient matrix and a class of weighted covariance matrices. Under the sparse or low rank structure, we conduct consistent estimation and variable selection for high dimensional quadratic regression and high dimensional quadratic discriminant analysis. From the perspective of matrix to study high dimensional regressions with interactions, the resulting model will have good structures and model interpretability. The new methods will also be evaluated by the real applications in biomedical and other related areas.

在回归模型中考虑解释变量之间的交互效应,是对当前线性模型的自然延伸,很多实际数据也表明解释变量之间的交互效应的确能给应变量带来影响。交互效应模型在经典统计分析中有所研究,例如二次回归分析和二次判别分析等。由于交互项数量随着数据维度呈平方形式增长以及自身具有结构性,高维交互效应模型给当前统计分析带来很大的挑战。本项目拟从回归函数的海森矩阵出发,研究高维情形下交互效应模型的充分性降维问题。特别的对二次回归分析和二次判别分析,海森矩阵对应着模型中的交互效应回归系数矩阵。通过对海森矩阵的研究,建立回归系数矩阵和一类加权协方差矩阵之间的关系。从稀疏和低秩两种不同模型结构下构造出高维二次回归分析和二次判别模型的相合估计以及相关的变量选择方法。基于矩阵的角度来研究高维交互效应模型,所得结果将具有更好的结构性和可解释性,新的方法也将被应用到信息技术、生物医学等领域解决一些实际问题。

项目摘要

在高维数据分析中考虑非线性结构是对当前高维线性模型的一个自然延伸,本项目主要基于两种重要的充分降维方法CUME方法和PHD方法研究了高维非线性模型。项目主要研究内容包括以下几个方面: 1. 对于CUME方法,为了研究其如何拓展到高维情形,我们在一般情形下探讨了方法的理论相合性。在高维稀疏情形下,构造出对应协方差矩阵和降维矩阵在谱范数下的相合估计,从而把CUME方法推广到了高维数据情形。2. 基于PHD方法,我们研究了二次型回归模型。在传统的线性模型中引入交互项,对于处理复杂的数据分析问题,从模型解释性和预测效果上都能得到很大的提高。基于PHD方法的核心思想,在一定条件下,我们给出了二次型回归模型中参数的显示表达式。在高维稀疏情形下,构造了一个一步的LASSO估计,并且从理论上证明了方法的有效性,算法上基于经典的ADMM算法设计出了高效实用的算法,从而在较为一般的条件下解决了高维稀疏的二次型回归问题。3. 在CUME和PHD的工作基础上,我们研究了高维数据分析中重要的精度矩阵估计的算法问题。高维精度矩阵在很多统计问题中都扮演着重要的作用,现有的算法在处理高维数据时并不是非常高效。我们基于前期工作基础,充分利用统计中高维数据大p小n的特点,对于二次型损失类型的高维精度矩阵估计方法,重新设计了其ADMM算法,从算法复杂度上得到最优的算法。进一步的对于两个精度矩阵相减的差异矩阵,我们基于另一个经典的FISTA算法也给出一个复杂度上最优的新算法。对于大p小n的高维数据,这些算法相对于已有结果效率上都有很大提高,大大加快了相关统计问题中的计算速度。 .项目按照预期研究计划进行,发表了五篇高水平一作或通讯作者学术论文,在相关方向上都取得了一定的进展,得到国际同行的高度关注,为后续的科研找到了新的方向,对于高维复杂数据的统计分析做出了一定的贡献。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

王成的其他基金

批准号:91022005
批准年份:2010
资助金额:50.00
项目类别:重大研究计划
批准号:41171279
批准年份:2011
资助金额:65.00
项目类别:面上项目
批准号:21171159
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:10202001
批准年份:2002
资助金额:22.00
项目类别:青年科学基金项目
批准号:30170163
批准年份:2001
资助金额:16.00
项目类别:面上项目
批准号:41604157
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81202136
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:61202383
批准年份:2012
资助金额:26.00
项目类别:青年科学基金项目
批准号:81703395
批准年份:2017
资助金额:20.10
项目类别:青年科学基金项目
批准号:10972040
批准年份:2009
资助金额:44.00
项目类别:面上项目
批准号:81870493
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:81772282
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:U1830139
批准年份:2018
资助金额:64.00
项目类别:联合基金项目
批准号:81401257
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:21571170
批准年份:2015
资助金额:70.00
项目类别:面上项目
批准号:31660497
批准年份:2016
资助金额:39.00
项目类别:地区科学基金项目
批准号:61801514
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:81900268
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:51475210
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:81572661
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:61501493
批准年份:2015
资助金额:19.00
项目类别:青年科学基金项目
批准号:81000298
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:10572026
批准年份:2005
资助金额:40.00
项目类别:面上项目
批准号:31900068
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目
批准号:41671434
批准年份:2016
资助金额:65.00
项目类别:面上项目
批准号:61804095
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:20671087
批准年份:2006
资助金额:30.00
项目类别:面上项目
批准号:41804026
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:61403153
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:31872754
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:71301148
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:51305142
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:31701441
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:11272056
批准年份:2012
资助金额:90.00
项目类别:面上项目
批准号:51044008
批准年份:2010
资助金额:10.00
项目类别:专项基金项目
批准号:81670666
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:31500806
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:30060017
批准年份:2000
资助金额:17.50
项目类别:地区科学基金项目
批准号:61571331
批准年份:2015
资助金额:57.00
项目类别:面上项目
批准号:51304065
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:11732003
批准年份:2017
资助金额:340.00
项目类别:重点项目

相似国自然基金

1

高维半参数回归模型中的若干检验问题

批准号:11401391
批准年份:2014
负责人:张君
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目
2

超高维半参数回归模型的结构识别和变量选择问题研究

批准号:11401340
批准年份:2014
负责人:王明秋
学科分类:A0402
资助金额:23.00
项目类别:青年科学基金项目
3

高维椭球 Copula 回归模型的变量选择及变点检测问题研究

批准号:11801316
批准年份:2018
负责人:何勇
学科分类:A0402
资助金额:26.00
项目类别:青年科学基金项目
4

高维回归模型的预测稳定性研究

批准号:11626159
批准年份:2016
负责人:林炳清
学科分类:A0402
资助金额:3.00
项目类别:数学天元基金项目