Both longitudinal data and recurrent event data are important types of complicated data which usually appear in medical and economic studies. There have been a large number of articles analyzing longitudinal data under the framework of point processes. However, almost all of existing articles assume that the longitudinal process, the observation process and the censoring time are independent conditional on covariates and latent variables. In practice, the dependent structure among them are always more complicated and difficult to verify. To avoid the risk of the dependent structure misspecified, in this project, we will propose a more flexible and robust semiparametric joint model to analyze longitudinal data with informative observation times and dropouts. Further, we will consider joint modeling and statistical inference of longitudinal data where the rescaling time for the longitudinal process is different from the observation process. In recent years, there have been many articles on modeling and analyzing of the recurrent gap time data, but all covariate effects are assumed to be linear. However, this assumption is sometimes too restrictive or unrealistic in many applications. In this project, we will propose a model that can accommodate both linear and nonlinear covariate effects for the analysis of recurrent gap time data. Finally, all models and methods proposed in the project will be used to analyze real data sets, aimed at providing some suggestions for workers.
纵向数据和复发事件数据是在医学、经济学等领域经常出现的两类重要的复杂数据。对于纵向数据,已经有很多文献在随机过程的框架下对其进行分析,但是通常要求在给定协变量和潜变量的条件下,纵向响应过程、观测过程和删失时间三者相互独立,然而实践中这三者的相依结构往往更为复杂而且难以验证。为避免对相依结构的错误假定,本项目将对带信息观测和信息删失的纵向数据提出更具灵活性和稳健性的半参数联合模型;并且进一步考虑纵向响应过程和观测过程时间尺度变换不一致的情形下的联合建模和统计推断问题。对于复发事件数据,近些年有很多文献以间隔时间为对象进行建模和分析,但都假定协变量效应是线性的,然而在实际应用中这个假定有些时候是不切实际的。本项目要研究能够适用于同时带线性和非线性效应协变量情形的模型并进行统计分析。最后将本项目所提出的模型和方法应用于实际数据分析,给实际工作者提供一些建议和指导。
纵向数据、复发事件数据和生存数据是在医学、经济学等领域中经常出现的几类重要的复杂数据,挖掘这些数据背后的信息是非常重要的一类问题。由于这些数据结构的复杂性且内部的相关性难以验证,因此需要在建模中尽可能地减少或减弱假设和限制条件,从而减小模型误设的风险。本项目提出更具灵活性和稳健性的半参数回归模型,对模型中的未知参数构建合理的估计方程进行参数估计,并且建立参数估计的大样本渐近理论性质,此外采用数值模拟验证模型中估计量的有限样本性质。最后将所提出的模型和估计方法用于实际数据分析。主要成果如下:(1)对复发间隔时间建立了一类部分线性转移模型。相比于已有的只能适用于线性效应协变量的转移模型,该模型能够适用于同时具有线性效应和非线性效应协变量的情形,并且转移模型本身是一类很广泛的模型,常见的比例风险模型和比例优势模型都是其特例。(2)针对带信息删失的复发事件数据提出了一种联合建模的方法。对终止事件采用了可加可乘的风险模型,对复发事件采用了比例强度模型,并且采用脆弱变量用来刻画复发事件与终止事件之间的相关性,而且对脆弱变量没有做分布假设,降低了模型误设的风险。(3)提出了关于有长度偏差的生存数据的一类广义可加可乘的风险模型,采用估计方程并加入长度偏差抽样机制的信息进行统计推断。(4)提出了长度偏差右删失数据下比例均值剩余寿命模型的一种估计方法。在估计方程构造中添加了额外的信息,通过组合的方法得到了新的估计,提高了参数估计的效率。这些研究成果可以为实际应用中的这几类复杂数据分析提供一些参考和指导。以上成果已经形成4篇科研论文,发表于国际重要期刊和国内核心期刊。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
气载放射性碘采样测量方法研究进展
带终止时间的复发事件数据的统计分析及其应用
混合复发事件数据的统计分析及其他
纵向数据与生存数据的半参数联合模型
纵向数据的动态半参数建模及其统计推断