The proposal focuses on developing statistical model and robust inference procedure for complex longitudinal data. The main content is composed of: 1) Under the framework of robust generalized estimating equations, we will develop proper joint mean and covariance models for longitudinal data with missing values. Meanwhile, we will investigate some new robust joint mean and covariance models and variable selection procedure. An appealing feature of the proposed joint modeling method is that it can accommodate irregular and subject-specific observation times; 2) For zero-inflated longitudinal data set, we will study novel statistical models and robust inference based on the generalized estimating equations; 3) We will study robust inference for zero-inflated longitudinal data set with missing values. The performance of the proposed methods will be evaluated by a range of simulation studies and the developed models and methods will be applied to real data analysis.
本课题研究复杂纵向数据的统计建模和稳健推断。主要研究内容有:1)基于稳健的广义估计方程方法研究含有缺失值的纵向数据的联合均值协方差模型的统计推断,同时也发展一些新的适用于缺失数据的有效的稳健模型和变量选择方法。此类方法的优势之一是能有效的应用于对不同个体测量时间不规则的纵向数据分析;2)针对零膨胀纵向数据,研究基于广义估计方程的统计模型和稳健推断问题;3)研究含有缺失值的零膨胀纵向数据的稳健推断。本课题的研究将通过丰富的计算机模拟检验所提方法的有效性,并将新方法应用于实际问题的分析。
本课题就复杂纵向数据的统计建模推断完成了以下主要研究内容和重要结果。.1)基于广义估计方程理论提出含有脱落型缺失值的高维纵向数据的变量选择方法,提供了变量选择相合性的理论证明、模拟比较和实际应用范例,是一种新的适用于实际高维随机缺失纵向数据的变量选择方法。.2)完成复杂纵向数据中联合均值协方差模型的统计推断,并将此模型用于癌症生活质量纵向数据的分析,以及探索影响肿瘤及其他慢性病生活质量的危险及保护因素。模型不需要关于纵向响应的密度函数和边界值的概率函数的特定参数假设,并且可以捕获时间或其他感兴趣的变量对均值和协方差的动态非线性关系。.3)在复杂纵向数据的基础上,进一步提出刻画时间-空间数据依时间变化的相关结构的局部特征的统计模型。我们的模拟研究和应用于脑电图的数据分析表明,带惩罚的非参数变系数模型去估计相关矩阵的逆可以同时刻画时空相关结构的动态变化。.4)另外还将上述方法应用于肿瘤大数据、地区流感数据,完成了多篇应用性的文章,为这些新方法在实际中的应用提供了多方面的范例和说明。.科学意义:在统计理论上做出了贡献,为实际数据分析提供了合适的方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
黄河流域水资源利用时空演变特征及驱动要素
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
中国参与全球价值链的环境效应分析
纵向数据动态模型的稳健统计推断
关于纵向数据的诊断分析与稳健建模
基于半参数模型的纵向数据的稳健统计推断方法
基于经验似然的纵向数据统计模型的稳健推断