高维生存数据的统计推断

基本信息
批准号:11471086
项目类别:面上项目
资助金额:68.00
负责人:崔霞
学科分类:
依托单位:广州大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:杨广仁,罗羡华,李元,熊强,宋泽芳
关键词:
估计方程方法变量筛选Cox模型平均剩余寿命模型高维生存数据
结项摘要

Inference for high-dimensional survival data has been attracted many interests in recent several years. This project is devoted to the study of variable screening and variable selection of several kinds of proportional hazards models and mean residual life models, which include Cox proportional hazards model, time-varying Cox model, Cox model with time-dependent covariates, semiparametric additive hazards model, proportional mean remaining life model (MRL), additive MRL model, time-varying proportional MRL model, time-varying additive MRL model. First, (group) SIS approach is adopted to screen variables, then some important variables are held in the model. Second, penalized partial likelihood and penalized inverse probability weighted quasi-likelihood are used to select variables having non-zero effect. In the SIS step, we will study the property of sure screening, and develop some available fast iterative algorithms. In the second step, we focus on the consistency of selection and asymptotic property of the proposed estimators while construct algorithms based on cyclic coordinate descent algorithm. Finally, we will provide some related simulations and empirical studies. Due to the complexity of high-dimensional survival data, our study is challenging. This project will greatly enrich theories of statistical inference for high-dimensional survival data.

高维生存数据的统计推断已发展成为统计研究的热点问题。本项目致力于研究几类比例风险模型和平均剩余寿命模型的变量筛选和变量选择,包括:Cox比例风险模型、时变Cox模型、具有时间相依协变量的Cox模型、半参数可加风险模型、比例平均剩余生命模型、可加平均剩余寿命模型、变系数比例平均剩余寿命模型、变系数平均可加剩余寿命模型。我们通过(集群)SIS方法对变量做第一步筛选,然后用惩罚偏似然方法或惩罚逆概率加权拟似然对过滤后的变量做选择。在第一步中研究当协变量的维数以指数方式增长时,SIS方法的sure screening性质,并开发快速可行的迭代算法;在第二步中研究选择方法的相合性和所得估计量的渐近正态性,同时建立基于循环坐标下降的快速算法。最后进行数值模拟和实证分析研究。由于高维生存数据本身的复杂性,该项目的研究极具挑战性。本项研究将大大丰富高维生存数据的统计推断方法。

项目摘要

本项目主要在以下四个方面展开了研究工作:高维数据(包括但不限于高维生存数据)的统计推断;分层标记的比例风险模型及其在HIV疫苗效力试验中的应用;不可忽略缺失数据模型的可识别性和统计推断及其在教育收益率估计中的应用;多项有序logit模型和部分线性模型的统计推断。 . (a)提出了有超高维协变量Cox模型、可加Cox模型、变系数Cox模型、广义可加模型、广义变系数模型的特征筛选方法,研究了Cox模型部分似然的渐近性质。该特征筛选方法与SIS是不同的,因为它依赖于潜在活跃协变量的联合似然函数,而不是一个边际筛选方法。该方法能够有效地识别出活跃协变量,特别是那些与因变量边际独立但联合相依的,且有sure screening的性质。研究了高维分位数可加模型和高维变系数部分线性模型的结构确定问题。提出了fused-MCP,保持原始信号的轮廓和保留边缘结构方面比fused lasso表现更好。提出了大维稀疏协方差矩阵的稳健估计(可以达到最佳收敛速度)。对于假设两样本网络有相同的边概率矩阵,构造了拟合优度检验统计量。. (b)研究了两阶段生物标记取样下的分层标记特定的比例风险模型。建立了基于完整案例的逆概率加权和完整案例的增强逆概率加权的估计和推断过程。当协变量缺失时,给出了假设检验程序(基线函数可能随着分层而变化),证明了预测辅助量在恢复效率方面的双重鲁棒性和有效性。. (c)在缺失机制是参数模型的假设下,通过向观测数据空间上投影构造了条件得分函数,证明了所得估计量是相合的和渐近正态的。对于响应变量是不可忽略缺失的广义线性模型,解决了识别性问题,并给出了估计方法,该模型应用于中国家庭收入项目研究的数据集分析。. (d)提出了一种灵活但计算简单的方法来估计部分线性模型。提出了一种简单的单变量正态混合模型的根选择方法。对于多项有序logit模型下的模型平均估计,通过最小化M-fold交叉验证标准提出了一种权重选择方法。使用高维经验似然方法,建立了单指标模型参数的联合置信域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
4

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

崔霞的其他基金

批准号:41401472
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:30971619
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:11871173
批准年份:2018
资助金额:55.00
项目类别:面上项目
批准号:11871112
批准年份:2018
资助金额:55.00
项目类别:面上项目
批准号:10226026
批准年份:2002
资助金额:2.50
项目类别:数学天元基金项目
批准号:11026194
批准年份:2010
资助金额:3.00
项目类别:数学天元基金项目
批准号:51864035
批准年份:2018
资助金额:40.00
项目类别:地区科学基金项目
批准号:11271054
批准年份:2012
资助金额:68.00
项目类别:面上项目
批准号:31572140
批准年份:2015
资助金额:25.00
项目类别:面上项目
批准号:31271363
批准年份:2012
资助金额:85.00
项目类别:面上项目
批准号:11101442
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:10501004
批准年份:2005
资助金额:14.00
项目类别:青年科学基金项目

相似国自然基金

1

纵向数据与生存数据联合模型的统计推断

批准号:11601060
批准年份:2016
负责人:宋慧
学科分类:A0403
资助金额:19.00
项目类别:青年科学基金项目
2

高维数据的图模型学习与统计推断

批准号:11201479
批准年份:2012
负责人:尹建鑫
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
3

高维数据统计推断专题讲习班

批准号:12126428
批准年份:2021
负责人:潘东东
学科分类:A0402
资助金额:20.00
项目类别:数学天元基金项目
4

基于边际模型的聚类生存数据的统计推断

批准号:11401072
批准年份:2014
负责人:牛一
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目