Recurrent event data is widely encountered in many fields, such as biomedical studies, epidemiological studies and so on. For the statistical analysis of recurrent event data, statisticians and practitioners are concern about the affects of covariates on the occurrence rate. When the dimension of covariates is high, it is needed to establish a parsimonious model through the variable selection. The existing literature about variable selection for recurrent event data is relatively little, and only concerns the important main terms of the covariates and the situation with fixed dimension of covariates. Based on the method of coefficient shrinkage, the project is going to investigate the variable selection methods with strong and weak heredities for recurrent event data under the proportional and additive rate models when the dimension of covariates is fixed or diverging. In addition to the theoretical properties, this project will also verify the performance of the proposed methods under the finite samples through numerical simulations and apply the proposed methods to real data examples.
复发事件数据经常出现在生物医学、流行病学等领域。对于复发事件数据的统计分析,常常关心的是协变量对复发事件发生率的影响。当协变量维数较高时,为了增加模型的预测性和可解释性,就需要通过变量选择方法来建立合适的模型。现有关于复发事件数据变量选择的研究还相对较少,且仅限于协变量维数固定及复发事件仅与协变量的主效应有关的情形。本项目拟在协变量具有交互效应时,基于系数压缩法,研究协变量维数固定和发散两种情形下比例比率模型和加性比率模型的具有强遗传性和弱遗传性的变量选择方法。另外,本项目在给出相应方法理论性质的同时,还将通过数值模拟研究所提出方法在有限样本下的表现,并把研究成果应用到实际数据的统计分析中。
复发事件数据经常出现在生物、医学、社会和经济学等研究领域。比例比率模型和加性比率模型是分析该类数据时最常用的两个半参数模型,其理论研究和应用都受到了广泛的关注。实际问题中经常遇到对复发事件时间有潜在影响的协变量维数较高的情况,给经典的统计推断方法带来了新的挑战。本项目研究了比例比率模型和加性比率模型下协变量具有交互效应时,具有遗传性的变量选择方法,取得的主要成果有:通过重参数的技巧,采用零均值过程构造无偏估计方程的方法,然后利用SCAD和ALASSO惩罚函数,提出了具有遗传性的变量选择方法;进一步地,提出了一种有效的迭代计算算法来实施提出的方法;最后,利用Taylor展开,经典渐近理论和现代经验过程理论等理论工具得到了变量选择方法的相合性和Oracle性质。本项目还对研究内容进行了一些拓展,研究了一类新的部分线性变系数比率模型的统计推断问题,构造了变系数和固定系数的无偏估计方程,并证明了估计量的大样本性质,此外基于累积残差,提出了一个模型检验统计量;对于一般生存数据,研究了删失指示变量缺失时,加性危险率模型、比例平均剩余寿命模型下的统计推断问题。本项目的研究成果即在理论上丰富了复发事件数据的变量选择研究,又扩宽了复发事件数据的应用领域,具有一定的理论和应用价值。本项目目前已完成论文5篇,其中发表和接收的论文3篇(2篇SCI,1篇国际会议论文),在审论文2篇(SCI期刊)。此外,部分论文正在整理阶段。所完成的成果达到了项目的预期目标。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
非递进多状态复发事件数据统计建模及变量选择
高维生存数据下交互模型的变量选择方法
具有缺失数据的不同模型的变量选择及其应用
高维纵向数据的若干稳健变量选择方法研究