生存分析中变系数模型的超高维协变量的筛选研究

基本信息
批准号:11401443
项目类别:青年科学基金项目
资助金额:22.00
负责人:邓世容
学科分类:
依托单位:武汉大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:曹永秀,熊思灿,魏毅,熊晓英,张泽宇
关键词:
变量选择生存分析确保独立性筛选超高维数据变系数模型
结项摘要

Ultra-high dimensional data has become increasingly important in diverse fields of scientific research and technological development. In many censored data analysis, there may also involve ultra-high dimensional covariates, in which the effects of some important covariates on the censored time may vary with some other exposure covariate. In such case, we need to indentify the important covariates that have vary-coefficient effects on the censored time. Thus, this proposal is to establish the screening methods for vary-coefficient models in survival analysis with ultra-high dimensional covariates. Firstly, applicants plan to develop a new sure independence screening method based on some new marginal utility measure constructed from the marginal accumulative hazard function estimators, which can be obtained by the regularized survival analysis techniques after using B-splines approximation for the unknown vary-coefficients. Then the dimensionality of covariates can be reduced from ultra-high to a moderate scale through this sure screening method. Secondly, applicants will give the theoretical proof to verify that whether the proposed sure independent screening method has the sure screening property for even exponentially growing dimensionality. Finally, the methodology will be evaluated through extensive simulation studies and application to a real follicular lymphoma data set. Study of this proposal will provide beneficial attempt for the theoretical and application of the ultrahigh dimensional vary-coefficient models in survival analysis.

超高维数据在科学技术发展的各个领域里变得越来越重要。在许多生存数据的分析中,都涉及到超高维协变量,且某些重要的协变量对生存时间的效应可能会随着其他暴露变量而变化。在众多的协变量中,我们需要识别出那些对生存时间有变系数效应的重要协变量。因此,本项目拟建立不同的带有超高维协变量的生存时间的变系数风险模型。首先,采用非参数逼近的技术获得高维情形下累积危险率函数的估计,提出一种新的基于此估计的边际效用度量,以此来衡量每个协变量的重要程度,从而建立一种系统的变量筛选方法,达到将变量的维数从超高维降到一个适中的维数的目的。其次,申请者还计划证明提出的确保独立筛选方法在变量维数呈指数式增长的情况下具有确定筛选性质。最后,申请者拟通过大量的模拟研究及临床的滤泡性淋巴瘤的数据分析来验证我们提出的模型和方法的合理性与可行性。该项目的研究可为生存分析的超高维变系数模型的理论方法与应用研究提供有益的尝试。

项目摘要

本项目主要对超高维协变量下删失生存时间数据的变系数模型的确保独立筛选方法进行研究。对于带有超高维协变量的删失生存时间数据的变系数比例风险模型,提出了基于B-样条近似的边际累积危险率函数估计与非参数累积危险率函数的Aalen估计的差值构造的边际效用度量的确保独立筛选方法,证明了所提出的变量筛选方法的包括所提出的边际效用度量的合理性、确保独立筛选方法的确定筛选性质及对筛选变量子集个数的界的控制等理论性质,通过模拟计算分析了模型及方法的实际计算效果,并把所提出的模型和方法运用到实际的临床试验数据中,验证了提出模型及方法的合理性及可行性。受到本项目的资助,申请者基本完成了该项目中拟研究的第一个问题。作为其推广,研究二和研究三也将在后续工作中迅速完成。这些研究将为生存分析的统计研究带来新的理论成果,为临床医学、生物医学等应用提供更有价值的经验。此外,作为调整,若干生存分析领域的其他问题也被研究,相应工作都已顺利完成,在统计学国际学术期刊Computational Statistics and Data Analysis, Biometrical Journal, Acta Mathematicae Applicatae Sinica, English Series, Communications in Statistics- Simulation and Computation上各发表学术论文1篇。本项目资助了2名硕士生(其中1名硕博连读,1名已毕业工作)。本项目资助经费22万元,支出15.9702万元,各项支出基本与预算相符。剩余经费6.0298万元,剩余经费将用于本研究后续支出。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

邓世容的其他基金

相似国自然基金

1

含有相关或内生协变量的超高维模型的特征筛选

批准号:11601283
批准年份:2016
负责人:胡琴琴
学科分类:A0402
资助金额:18.00
项目类别:青年科学基金项目
2

超高维生存数据变量筛选和选择中若干问题的研究

批准号:11501573
批准年份:2015
负责人:陈晓林
学科分类:A0403
资助金额:18.00
项目类别:青年科学基金项目
3

协变量驱动的随机系数自回归模型的统计推断

批准号:11871028
批准年份:2018
负责人:王德辉
学科分类:A0402
资助金额:52.00
项目类别:面上项目
4

超高维数据的变量筛选方法

批准号:11371236
批准年份:2013
负责人:朱利平
学科分类:A0402
资助金额:55.00
项目类别:面上项目