高维回归模型的大规模统计学习和推断

基本信息
批准号:11871001
项目类别:面上项目
资助金额:53.00
负责人:李高荣
学科分类:
依托单位:北京师范大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:李万斌,李玉杰,孙慧慧,岳莉莉,陈冉冉,俞崇秀,李雪娇,杨鑫,孔凯笛
关键词:
大规模统计学习和推断多重假设检验因果推断高维数据分位数回归
结项摘要

In Big data era, the large-scale statistical learning and inference for high-dimensional regression models have become a hot and challenging topic, and it has attracted huge attention in many fields, such as statistics, economics, finance, biology, medicine, engineering, etc. There are many new and open statistical problems to be solved urgently. This project will consider these hot problems and conduct a systematic study on the large-scale statistical learning and inference, and its applications in high-dimensional setting with three aims as follows. (1) For the multiple hypothesis testing problems in high-dimensional regression models, we will develop knockoff method to control the false discovery rate (FDR) and finish the variable selection. In addition, we will extend the proposed knockoff method to high-dimensional semiparametric regression models and causal inference models. (2) For the high-dimensional regression models with the outliers and heavy tailed distribution, we will develop the quantile regression method and establish the asymptotic results. (3) For the high-dimensional causal inference models, we will study estimation and statistical inference of the treatment effect parameter of interest, and we will apply the proposed knockoff method and quantile regression method to causal inference models. Therefore, the aim of this project is to develop the new statistical methods and establish the corresponding theory results. We will further provide the statistical ideas, methods and theoretical basis for practical applications. Hence, it has theoretical significance and practical value to study this project, and the theory and application results should be obtained in this project.

在大数据时代,高维回归模型的大规模统计学习和推断引起了统计学、经济学、金融、生物、医学和工程等各个领域的高度关注,成为目前统计学研究的热点和具有挑战性的问题,并有许多亟待解决的开放性统计问题。因此,本项目针对高维数据中的若干热点问题进行研究,建立相应的理论体系,内容包括:(1) 对高维回归模型的多重假设检验问题,发展knockoff方法用于控制FDR和变量选择,并推广到高维半参数模型和因果推断模型;(2) 对具有离群点或重尾分布的高维回归模型,发展分位数回归方法,建立理论性质;(3) 对高维因果推断模型,研究模型中处理效应等兴趣参数的估计和统计推断,并把knockoff方法和分位数回归方法推广到该模型,建立相应的理论结果。本项目拟提出新的统计学习和推断方法,为实际应用提供统计思想、方法和基础理论。因此,本项目期望在理论上和应用上做出一定的成果,使得研究结果具有重要的理论意义和应用价值。

项目摘要

本项目主要致力于高维数据回归模型、因果推断模型、面板数据固定效应模型、非参数和半参数模型、测量误差模型等方面的大规模统计学习和统计推断进行系统研究。在研期间取得了一系列的研究成果,这些成果的主要内容有:(1) 针对高维或超高维数据回归模型,发展了一系列的统计学习方法并建立了相应的理论结果,如多重假设检验问题的knockoff方法,最优投资组合问题,纵向数据模型的非参数变量筛选问题和超高维判别分析特征筛选问题等;(2) 针对因果推断模型,提出了估计平均处理效应(ATE)和异质性处理效应(HTE)的统计学习方法,建立了估计量的渐近性质;(3) 针对面板数据固定效应模型,提出了模型中兴趣参数和非参数分量估计的统计学习方法,并对协方差矩阵的检验问题进行了系统研究;(4) 针对非参数和半参数模型,发展了一系列的统计学习方法。例如,对具有离群点和重尾分布的变系数模型和单指标变系数模型,发展了稳健的分位数回归方法,并研究了估计量的渐近性质;(5) 针对测量误差模型,提出了纠偏的统计学习方法或校正的估计程序,建立了估计量和检验统计量的渐近性质;(6) 通过模拟研究和实际数据研究验证和分析所提出统计学习方法和理论结果的可行性。.本项目的研究成果将为高维统计和非参数统计提供科学的统计学习方法,从而为金融、经济、生物学、医学、流行病学、环境科学和社会学等领域的研究提供了可行的统计学习方法和理论,同时也将丰富高维统计和非参数统计的研究内容。本课题在国内外重要学术期刊上发表学术论文27篇,其中SCI或SSCI收录23篇,在科学出版社出版1本著作《多元统计分析》。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
4

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

李高荣的其他基金

批准号:11471029
批准年份:2014
资助金额:72.00
项目类别:面上项目
批准号:11101014
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

高维异质性回归模型的融合分析和统计推断研究

批准号:11901352
批准年份:2019
负责人:严晓东
学科分类:A0403
资助金额:25.00
项目类别:青年科学基金项目
2

高维数据的图模型学习与统计推断

批准号:11201479
批准年份:2012
负责人:尹建鑫
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
3

高维数据下多因变量回归模型的统计推断

批准号:11401378
批准年份:2014
负责人:罗珊
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
4

超高维半参数回归模型的统计推断

批准号:11071077
批准年份:2010
负责人:朱利平
学科分类:A0402
资助金额:25.00
项目类别:面上项目