Recently interval censoring become the hot topic in survial anlaysis. The statisticians give more systematic research achievements under the conditon that the interested failure time is independent of the censoring variables. In practical application, however, the independent condition is not satisified ,that is there exists dependence between the failure time and censoring time. we call it dependent censoring(or informative censoring). we focus on studing the statistical inference on dependent interval censoring data using related knowledge of copula theory and regression analysis with covariate in our fund. we seperately perform the statiscal inference on dependent interval censoring case I and case II and regression analysis with covariate; develop the statistical inference on dependent censoring based on empirical likelihood; and perform the statistical inference on dependent interval censoring with copula model and frailty model. Expected achievement in our project not only improve the progress of the statistical inference of dependent censoring data in survival analysis, but also provide theoretical support in the biological field and medical field and so on.
近些年来区间删失问题成为生存分析中研究的热点问题,在失效时间变量和删失变量独立的假定下,统计学家给出了比较系统的研究成果,然而在实际应用中,经常会遇到失效时间变量和删失变量不满足独立性假定的问题,即失效时间变量和删失变量之间存在相关性(相依删失)。本课题旨在考虑这类相依删失(信息删失)问题,即利用Copula理论的相关知识探索相依删失数据类型下统计推断问题,分别讨论区间删失I型数据即现状数据下和区间删失II型数据下的基于Copula理论的生存函数的各种非参数估计方法和带有协变量影响因素下的回归分析的统计推断;建立基于经验似然的相依区间删失的统计推断;研究将Copula模型和Frailty模型相结合解决相依区间删失问题。本项目的预期成果将会进一步推动生存分析中相依删失数据统计建模的发展,还将为生物医学等领域提供理论支持.
本项目按照任务书中工作安排,有条不紊的开展了研究,取得了一系列的研究成果,很好的完成了各项研究内容。具体如下:针对相依区间删失数据建模问题,基于Copula模型给出了感兴趣的失效时间变量的生存函数的非参数估计,通过大量模拟研究验证模型方法的有效性;利用经验似然方法有效解决相依区间删失数据回归模型的统计推断问题。针对诱导相依删失医疗费用数据的统计建模问题,首先给出了基于线性变换模型下MLE估计和贝叶斯估计的统计推断问题;其次给出基于失效时间变量和删失医疗费用数据的诱导相依删失关系,利用变换模型给出其回归分析的统计推断问题,并做了大量的模拟研究验证了模型方法的有效性,并给出了其大样本性质的证明。针对AH模型下现状数据的贝叶斯自适应LASSO的变量选择问题,我们应用快速MCMC算法来完成贝叶斯自适应Lasso方法。并且通过大量模拟验证了模型方法的有效性,并且应用到香港II型糖尿病并发症-心脏病风险影响因素的数据分析中。针对逐步I型区间删失数据的建模问题,基于广义混合指数分布,利用极大似然估计和EM算法相结合有效地解决了复杂的数据结构和混合广义指数分布族会带来似然函数里的超多参数的估计问题,通过大量的模拟研究验证了模型估计方法的有效性,并将此模型应用于分析374名患有恶性疾病数据,进一步给出了其患病后存活的生存分布。针对潜变量模型的区间删失I型数据及多元区间删失I型数据建模问题,解决了加性风险模型的联合建模问题,此模型方法的优势在于引入潜变量,可以解决很多很难直接观测到的数据,进而使用替代变量,从中提取有效因子,尽而更直观的分析对感兴趣变量的回归影响。模型设置了不同的环境进行了大量的模拟,进一步验证了带潜变量的区间删失I型数据的联合回归建模方法的有效性,并将此方法应用于香港糖尿病并发症的数据分析中。本项目基于相依区间删失数据所得的研究结果可以更好的应用于临床医疗、公共健康、医疗保险等应用领域。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
混采地震数据高效高精度分离处理方法研究进展
白郡符从脾胃论治外科疾病经验探析
任意区间删失数据的统计分析
高维的相依区间删失数据的回归分析
带有相依观测过程的混合型区间删失数据的统计推断研究
带有治愈亚组的区间删失数据的统计分析及其应用