Biopharmaceutical industry is one of the seven strategic industries in the state’s 13th “Five-year plan”. Valid and efficient statistical analysis methods are essential for interpreting the clinical research data sets. This proposal intends to study the methodology for panel count data which are frequently encountered in medical researches. Since there is a lack of nonparametric regression methods for panel count data, we aim to develop regression method for time-varying coefficients and nonparametric covariate functions. We will consider both likelihood-based and estimating equations based approaches. We will use spline and local kernel methods to estimate the time-varying coefficients, use spline to estimate the nonparametric covariate function, and construct the test statistics to test the hypotheses of whether the time-varying coefficients or constant coefficients are needed. We will employ empirical process theory to derive the asymptotic properties of estimators of time-varying coefficients and nonparametric covariate functions, conduct numerical simulation to evaluate the small sample properties of the proposed estimators and their variance estimators, and apply the proposed estimation procedure to the medical data analysis. Upon completion of this project, we will develop a set of nonparametric regression methods and a software package for panel count data analysis, therefore, fill in the theoretical and application gaps of nonparametric panel count data models.
生物医药为国家“十三五”规划的七大支柱产业之一。合理高效的统计分析方法对正确理解临床医学研究数据有关键的作用。本项目研究医学研究中常见的面板计数数据分析方法。传统的面板计数数据模型假定回归系数为常数。针对其中的非参数回归分析研究缺口,发展带时变系数和非参数协变量函数的回归分析方法。在似然函数方法和估计方程方法的框架下,用样条和核估计方法来估计时变系数函数,用样条方法估计非参数协变量函数,并且构造检验统计量来检验是否需要进行时变系数还是常系数的回归估计。通过运用经验过程理论推导时变系数和非参数协变量函数估计量的渐近性质,采用数值模拟方法检验点估计量及方差估计量的有限样本性质,应用医学研究数据测试估计方法的实用性。从而发展适用于面板计数数据的非参数回归方法,编写适用于面板计数数据的分析软件包。完成本项目将为准确分析和理解医学研究中的面板计数数据提供一套非参数回归分析理论及应用工具。
本项目在生存分析模型中发展非参数回归方法,主要针对面板计数数据模型模型中的时变系数和非参数协变量进行研究,并且把发展的方法应用到生物医学数据分析之中。我们(a)首先用研究样条方法在带时变系数的面板计数数据模型中的统计推断问题,在假定非同质泊松边际分布下构造伪似然函数,我们将运用回归样条(regression spline)拟合时变系数。证明了研究时变系数的样条估计的相合性及小样本性质情况下的无偏差性质,并用测试交叉校验法进行常数选择。(b)同时,我们还发展了非参数协变量函数的面板计数数据模型中的样条估计量;(c)我们还发展核估计在时变函数和非参数协变量中的估计方法。验证了其估计的相合性和渐近正态性及小样本性质。(d)此外我们还开展了在相关生存分析模型(联合模型,竞争风险模型,生存分析中介效应模型)中的变量选择和生物医学数据应用。. 通过本项目的支持,我们发表文章12篇,超过发表6篇论文的目标其中10篇为SCI论文,2篇为中文核心期刊,6篇为第一标注,4篇为第二标注,1篇为第三标注,1篇为第四标注。目前还有一篇第一标注的相关论文在SCI期刊Biometrics 二次修回当中。我们发展一套适用于面板计数数据的包括时变系数在内的非参数回归分析方法,编写了相关方法的R程序并提供在线的程序供数据分析人员使用,把研究方法应用于包括小儿哮喘,肝癌,心血管疾病等医学数据的分析。极大拓展了面板计数数据的使用范围,在医学上的应用也取得较好的影响,在顶级医学期刊Lancet子刊上发表相关文章。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
五轴联动机床几何误差一次装卡测量方法
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于图卷积网络的归纳式微博谣言检测新方法
医学研究中非独立数据的分析方法
面板计数数据模型的非参数和半参数统计推断
面板计数数据的统计推断以及应用
带有交互效应的面板数据分位数回归