基于稳健估计方程的联合均值协方差分析及超高维变量筛选

基本信息
批准号:11801466
项目类别:青年科学基金项目
资助金额:26.00
负责人:吕晶
学科分类:
依托单位:西南大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:朱冰洁,陈波,鲁盈吟,胡爽,周玮,王蕊
关键词:
超高维变量筛选稳健广义估计方程纵向数据线性模型
结项摘要

In the existing research results, researchers need to specify the within-subject correlation structure to improve the estimation efficiency when analyzing missing longitudinal data. Thus, it is lack of flexibility. In addition, since multivariate longitudinal data involves the correlations arising between multiple responses, how to effectively extend some robust estimation approaches in univariate longitudinal data to multivariate longitudinal data is an urgent task. Based on the above problems, this project aims to solve the within-subject correlation, empirical likelihood inference and ultrahigh dimensional variable screening in the analysis of missing (or multivariate) longitudinal data. Firstly, under the structure of missing longitudinal data, we apply the modified Cholesky decomposition (or hyperspherical coordinates) to deal with the within-subject correlation structure of quantile regression (or rank regression), and construct the robust joint mean-covariance models and empirical likelihood ratio statistics. Secondly, the nested modified Cholesky decomposition is used to deal with the complex correlation structure in multivariate longitudinal data, which aims to improve estimation efficiency. Thirdly, we propose ultrahigh dimensional variable screening approaches based on the robust generalized estimating equations, and study their theoretical properties and algorithms. The project intends to address how to improve the statistical inference efficiency for missing or multivariate longitudinal data, and aims to study robust joint mean-covariance analysis and develop new ultrahigh dimensional variable screening methods. Thus, this project has both theoretical value and application prospect.

现有研究成果在分析缺失纵向数据时需指定组内相关结构以提高估计的效率,因此缺乏灵活性。此外多元纵向数据涉及多重相关,如何将一元纵向数据的稳健方法推广到多元纵向数据也是亟需解决的难题。本项目针对以上问题,以解决缺失(或多元)纵向数据的组内相关性、经验似然推断和超高维变量筛选为目标,拟开展以下三个方面的研究。首先,在缺失纵向数据框架下,利用修正的Cholesky分解(或超球面坐标法)处理分位数回归(或秩回归)模型的组内相关结构,并建立稳健的联合均值协方差模型和经验似然比统计量。其次,利用嵌套的修正Cholesky分解处理多元纵向数据的复杂相关结构以提高估计的效率。再次,基于稳健的广义估计方程提出超高维纵向数据的变量筛选方法并研究其理论性质与相关算法。本项目拟解决如何提高缺失(或多元)纵向数据的统计推断效率,旨在研究稳健的联合均值协方差分析和开发超高维变量筛选新方法,既有理论价值又有应用前景。

项目摘要

在超高维框架下如何进行准确的预测是生物、医学等研究领域的重要目标,因此预测方法的探索与创新是统计学界的研究热点问题。为了捕捉更多有用信息于最终模型中,进一步提髙预测精度,学者们提出模型平均方法,它可以灵活地调整最终模型的结构,减少信息遗漏,有效地提高预测精度。. 本项目主要研究了半参数统计建模、超高维特征筛选和统计预测,具体包括以下几个方面的内容。第一,项目组成员结合分位数回归和惩罚函数研究了高维变指标系数分位数回归模型的参数估计、变量选择以及模型结构识别问题;第二,结合AdaBoost方法与多元变系数逻辑回归研究了多分类数据的预测问题;第三,在超高维数据框架下,结合复合分位数和惩罚函数提出了稳健的模型平均预测方法;第四,在删失数据框架下,结合一元和二元非参数回归与hazard模型建立了可加形式的模型平均预测方法;第五,结合分位数回归、变系数模型与惩罚函数研究了超高维协变量下的条件分位数预测问题。. 本项目已完成超高维特征筛选、候选子模型的设计、模型权重向量的估计以及模型平均理论分析与数值算法的研究。该项研究不仅可以弥补现有单个模型预测方法不能有效地规避模型误判风险的缺陷,而且为超高维领域的统计预测建立全新的理论体系以期大幅度提高预测精度。截至目前,项目组成员一共发表(或录用)5项研究成果,已顺利完成了本项目的预定任务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

吕晶的其他基金

批准号:51908046
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目

相似国自然基金

1

超高维病例队列数据的联合变量筛选研究

批准号:11801567
批准年份:2018
负责人:刘祎
学科分类:A0403
资助金额:25.00
项目类别:青年科学基金项目
2

超高维数据的变量筛选方法

批准号:11371236
批准年份:2013
负责人:朱利平
学科分类:A0402
资助金额:55.00
项目类别:面上项目
3

基于稳健估计方程的复杂纵向数据研究

批准号:11501124
批准年份:2015
负责人:郑雪莹
学科分类:A0403
资助金额:18.00
项目类别:青年科学基金项目
4

时间序列模型中稳健且有效估计及稳健变量选择问题的研究

批准号:11301221
批准年份:2013
负责人:姜云卢
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目