In the existing research results, researchers need to specify the within-subject correlation structure to improve the estimation efficiency when analyzing missing longitudinal data. Thus, it is lack of flexibility. In addition, since multivariate longitudinal data involves the correlations arising between multiple responses, how to effectively extend some robust estimation approaches in univariate longitudinal data to multivariate longitudinal data is an urgent task. Based on the above problems, this project aims to solve the within-subject correlation, empirical likelihood inference and ultrahigh dimensional variable screening in the analysis of missing (or multivariate) longitudinal data. Firstly, under the structure of missing longitudinal data, we apply the modified Cholesky decomposition (or hyperspherical coordinates) to deal with the within-subject correlation structure of quantile regression (or rank regression), and construct the robust joint mean-covariance models and empirical likelihood ratio statistics. Secondly, the nested modified Cholesky decomposition is used to deal with the complex correlation structure in multivariate longitudinal data, which aims to improve estimation efficiency. Thirdly, we propose ultrahigh dimensional variable screening approaches based on the robust generalized estimating equations, and study their theoretical properties and algorithms. The project intends to address how to improve the statistical inference efficiency for missing or multivariate longitudinal data, and aims to study robust joint mean-covariance analysis and develop new ultrahigh dimensional variable screening methods. Thus, this project has both theoretical value and application prospect.
现有研究成果在分析缺失纵向数据时需指定组内相关结构以提高估计的效率,因此缺乏灵活性。此外多元纵向数据涉及多重相关,如何将一元纵向数据的稳健方法推广到多元纵向数据也是亟需解决的难题。本项目针对以上问题,以解决缺失(或多元)纵向数据的组内相关性、经验似然推断和超高维变量筛选为目标,拟开展以下三个方面的研究。首先,在缺失纵向数据框架下,利用修正的Cholesky分解(或超球面坐标法)处理分位数回归(或秩回归)模型的组内相关结构,并建立稳健的联合均值协方差模型和经验似然比统计量。其次,利用嵌套的修正Cholesky分解处理多元纵向数据的复杂相关结构以提高估计的效率。再次,基于稳健的广义估计方程提出超高维纵向数据的变量筛选方法并研究其理论性质与相关算法。本项目拟解决如何提高缺失(或多元)纵向数据的统计推断效率,旨在研究稳健的联合均值协方差分析和开发超高维变量筛选新方法,既有理论价值又有应用前景。
在超高维框架下如何进行准确的预测是生物、医学等研究领域的重要目标,因此预测方法的探索与创新是统计学界的研究热点问题。为了捕捉更多有用信息于最终模型中,进一步提髙预测精度,学者们提出模型平均方法,它可以灵活地调整最终模型的结构,减少信息遗漏,有效地提高预测精度。. 本项目主要研究了半参数统计建模、超高维特征筛选和统计预测,具体包括以下几个方面的内容。第一,项目组成员结合分位数回归和惩罚函数研究了高维变指标系数分位数回归模型的参数估计、变量选择以及模型结构识别问题;第二,结合AdaBoost方法与多元变系数逻辑回归研究了多分类数据的预测问题;第三,在超高维数据框架下,结合复合分位数和惩罚函数提出了稳健的模型平均预测方法;第四,在删失数据框架下,结合一元和二元非参数回归与hazard模型建立了可加形式的模型平均预测方法;第五,结合分位数回归、变系数模型与惩罚函数研究了超高维协变量下的条件分位数预测问题。. 本项目已完成超高维特征筛选、候选子模型的设计、模型权重向量的估计以及模型平均理论分析与数值算法的研究。该项研究不仅可以弥补现有单个模型预测方法不能有效地规避模型误判风险的缺陷,而且为超高维领域的统计预测建立全新的理论体系以期大幅度提高预测精度。截至目前,项目组成员一共发表(或录用)5项研究成果,已顺利完成了本项目的预定任务。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
超高维病例队列数据的联合变量筛选研究
超高维数据的变量筛选方法
基于稳健估计方程的复杂纵向数据研究
时间序列模型中稳健且有效估计及稳健变量选择问题的研究