Case-cohort design is a widely used cost-effective method in large-scaled epidemiologic studies. The existing studies on this field are extensive but most of them focus on the situation where the dimension of the covariates is low. The project aims to develop the statistical inference methods for variable selection in the case-cohort design for high dimensional cases under the framework of the Cox proportional hazards model, the additive hazards model and the accelerated failure time model. We adopt the folded concave penalties to obtain the penalized estimators and establish the asymptotic properties. The MBMD algorithm and the smoothed quasi-Newton algorithm with line search approach are used to get the solution path. Simulation studies are conducted to evaluate the finite sample performance of the proposed methods and the real data is analyzed to illustrate the application of the proposed methods.
在大型流行病学的研究中,病例队列设计是一种广泛应用的节约成本、提高效率的方法,目前已有大量的研究成果,但集中在协变量维数较低的情形。本项目拟在高维协变量下,研究病例队列设计中的变量选择问题。我们将在Cox比例风险模型、加法风险模型、加速失效时间模型的框架下基于folded concave惩罚函数类建立相应的统计推断方法,并构建惩罚估计量的大样本理论性质。计算方面我们将运用MBMD、带有线性搜索技术的光滑化拟牛顿算法来求得惩罚估计值。利用模拟计算衡量我们提出的统计推断方法在有限样本下的表现,将之运用到实际数据中。
在大型流行病学的研究中,探讨高维病例队列数据的变量选择的研究,对理解疾病起因、寻找致病因素有着深远的意义。在生存分析领域针对于几种常见的半参数回归模型,基于惩罚似然的方法由于可以同时实现参数估计和变量选择的双重目标被广泛应用。本项目首先考虑了Cox比例风险模型框架下基于SELO-惩罚函数的变量选择问题,并且提出了MSQN用于求解SELO-惩罚估计,得到了惩罚估计量的相合性以及Oracle性质;进一步地针对于高维数据的变量选择问题提出了广义SELO-惩罚函数族,并分别在线性回归模型以及Cox比例风险模型的框架下考虑了基于广义SELO-惩罚函数族的变量选择问题。然后提出了ADMM算法用于求解基于MCP惩罚函数的惩罚最小二乘问题,得到了算法的收敛性质,数值模拟结果表明我们提出的ADMM算法相较于经典的坐标下降算法表现相当。针对于疾病具有高发病率情形,提出了一种两阶段的广义病例队列抽样方法,并且在加速失效时间模型的框架下利用核方法进行插补进一步利用光滑化的增广的加权估计方程的方法来实现参数估计问题。最后针对于病例队列研究中,几种常见的模型假定是否成立的问题,分别考虑了Cox比例风险模型、加法风险模型下的模型诊断问题,我们建立了一类渐近零均值的随机过程统计量,给出了检验统计量的相关理论性质,并利用重抽样方式逼近上述检验统计量的渐近分布,通过数值模拟来研究所提出的方法在有限样本下的表现,并将方法应用于真实数据分析中。此项目既有重要的理论意义又有广泛的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
半参数/非参数回归模型的变量选择
半参数混合模型及变量选择研究
关于若干半参数统计模型中的变量选择方法的研究
含指标项半参数生存模型的估计和变量选择