高维回归系数的假设检验

基本信息
批准号:11671334
项目类别:面上项目
资助金额:48.00
负责人:钟威
学科分类:
依托单位:厦门大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:方匡南,刘婧媛,范青亮,王佳佳,刘西,段孙蓬,何琪琪,于海悦
关键词:
变量选择多重检验
结项摘要

With rapid advances of modern information technology, high dimensional data have frequently been collected in diverse fields including genomics, finance, engineering and among others. In high dimensional data, the number of covariates greatly exceeds the sample size. This "large p, small n" paradigm brings a lot of challenges to many traditional multivariate analysis procedures, such as simultaneous hypothesis testing. Testing a hypothesis for high dimensional regression coefficients is of fundamental importance in the statistical theory and applications. This project aims to develop several new tests for testing the significance of high dimensional regression coefficients. First, we propose a new U-type (UT) test for coefficients in high dimensional linear regression models based on an estimated U-statistics of order two and study its asymptotic distributions under two different distribution assumptions. The idea of refitted cross-validation (RCV) approach is utilized to reduce the bias of the sample variance and enhance the power performance of the UT test. Second, we develop a conditional U-type (CUT) test for testing the significance of a part of high dimensional regression coefficients. The CUT test can be applied to check whether a variable selection procedure unfits the regression model or not. Third, we propose a projection score test which projects the original high dimensional sample to a low-dimensional space, and study its optimal direction to achieve the best power under alternatives.

随着现代信息技术的快速发展,高维数据在很多领域都频繁地出现,例如基因学、金融学、工程学等。在高维数据中,自变量的个数通常远大于样本量。这种“大p小n”的特性给传统的多元统计方法带来了新的挑战,例如多重假设检验。对于高维回归系数的假设检验在统计理论和应用中都具有重要的作用。本项目旨在提出几种新的假设检验来验证高维回归系数的显著性。首先,我们基于估计的二阶U统计量提出一种检验高维回归系数的U型(UT)检验,并研究其在两种不同分布假设下的渐近分布。重复交叉验证(RCV)的想法也被用于减少样本方法的偏度,从而提升U型检验的功效。第二,我们进一步提出一种有条件的U型(CUT)检验,用于检验高维回归的部分系数。该CUT检验可用来检验变量选择方法是否低估了回归模型。最后,我们还提出一种投影得分检验,可以把原始高维样本降到低维样本进行分析,并研究其最优投影方向以到达在备择假设下的最优功效。

项目摘要

高维数据分析是近年来统计学研究的重要领域。本项目聚焦于高维数据回归模型的假设检验研究。我们提出了基于二阶U统计量和重复交叉验证(RCV)想法的高维线性回归系数显著性假设检验,并研究其在两种不同分布假设下的渐近分布,提出一种基于随机数据切分方法的超高维稀疏线性回归模型的部分系数显著性假设检验方法(CUTS),提出一种结合变量筛选的超高维模型拟合优度假设检验LOFTS方法,验证一个给定模型是否可以充分地刻画超高维数据的因变量的条件均值。在高维数据分析的变量选择方面,提出一种全新的复合决策系数(CCD)并且提出一种基于复合决策系数CCD的变量独立筛选方法(CCD-SIS),提出一种针对超高维非线性可加模型的向前回归变量筛选方法(FAR),提出一种通过极大化因变量和自变量线性组合的距离协方差的变量筛选算法(DC-TGDR)。在应用方面,研究团队将高维数据分析方法应用到计量经济学的内生变量问题、基因遗传学的基因筛选问题、文本数据的重要词汇选择问题等。在该面上项目的资助下,项目主持人的研究成果在The Annals of Statistics、Journal of the American Statistical Association、Statistica Sinica等发表论文8篇。此外,在该面上项目的资助下,研究团队主要成员刘婧媛在Journal of the American Statistical Association、Annals of Applied Statistics、Statistics in Medicine、Journal of Multivariate Analysis等发表相关论文6篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

冲击电压下方形谐振环频率选择超材料蒙皮的沿面放电长度影响因素研究

冲击电压下方形谐振环频率选择超材料蒙皮的沿面放电长度影响因素研究

DOI:10.13334/j.0258-8013.pcsee.182347
发表时间:2019
3

“意愿-风险”模型下地方政府间合作倾向研究——以泛珠三角为例

“意愿-风险”模型下地方政府间合作倾向研究——以泛珠三角为例

DOI:
发表时间:2018
4

前件变量未知的T-S模糊系统输出反馈控制

前件变量未知的T-S模糊系统输出反馈控制

DOI:10.13195/j.kzyjc.2018.0134
发表时间:2019
5

葡萄糖醛酸功能化双介孔硅对胆红素的高效吸附研究

葡萄糖醛酸功能化双介孔硅对胆红素的高效吸附研究

DOI:10.3969/j.issn.1001-9731.2020.01.015
发表时间:2020

钟威的其他基金

相似国自然基金

1

高维数据的假设检验

批准号:11271031
批准年份:2012
负责人:王汉生
学科分类:A0402
资助金额:50.00
项目类别:面上项目
2

高维半参数模型假设检验问题的研究

批准号:11501586
批准年份:2015
负责人:王思洋
学科分类:A0402
资助金额:18.00
项目类别:青年科学基金项目
3

基于充分降维方法的高维数据假设检验问题的研究

批准号:11201151
批准年份:2012
负责人:於州
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目
4

基于惩罚似然和经验似然方法的高维数据假设检验问题研究

批准号:11701023
批准年份:2017
负责人:王珊珊
学科分类:A0402
资助金额:24.00
项目类别:青年科学基金项目