The joint modeling of survival data and longitudinal data has been a hot topic in statistical research in recent years. It has been widely used in many scientific investigations such as biomedical researches. In realistic problems, however, the complexity of data structure may lead to inefficient statistical inferences by existing methods. In this project, we will introduce techniques of Functional Data Analysis into the framework of joint modeling, and extend existing methodologies to a new area. By thinking about data from a functional point of view, we will propose several data-adaptive methods to characterize the trajectory pattern and correlation structure of both longitudinal data and recurrent event point processes. Our methods will be based on different semi- and non-parametric approaches, such as generalized linear mixed model, functional principal component analysis, etc. Asymptotic properties will be studied accordingly. In the meantime, the performance and effectiveness of our method will be demonstrated by extensive simulation studies and data analysis. The proposed methods will also be applied in an analysis of public health problem.
生存数据与纵向数据的联合统计建模近年来成为统计学研究热点,并广泛应用于生物医学等众多科研领域中。然而在处理实际问题时,数据的复杂结构可能会导致现有方法在统计推断方面不够有效。本课题拟在前人的工作基础上,引入函数型数据分析的技术,将联合统计建模方法拓展到一个新的领域。在理论研究方面,我们从函数型数据的角度出发,利用广义线性混合效应模型和函数主成分分析等半参数与非参数的方法,对纵向信息和复发事件点过程的轨迹模式和相关性结构提出数据自适应的建模理论,并深入研究其大样本性质。同时,本课题还将通过大量计算机模拟与数据分析验证所提建模方法的有效性,并将其实际应用在公共卫生领域的研究中。
生存数据和纵向数据在很多科学领域,尤其是生物医学领域,都是非常常见的数据类型。在传统的统计学当中,分别针对生存数据和纵向数据的建模与分析,已经有了非常广泛并且深入的研究,但是将两种数据类型联合在一起进行建模的相关技术,最近二十年才逐渐发展起来,其中以参数或半参数的方法为多,对观测数据的格式和数据内相依结构都有着较强的假设。这些假设在现实的科学数据当中很有可能是不成立的,因此使得现有的许多联合统计建模方法无法在更广泛的范围内使用,或者得出的推断结果存在问题。在本项目中,我们主要考虑了两种数据类型:一种是复发事件(广义的生存数据)与稀疏纵向数据相联系,另一种是复发事件本身具有纵向结构。第一种数据类型在医学和行为学研究中非常常见,当复发事件在较长的时段上出现时,其他变量虽然相应地在较长时段上有纵向观测,但每个个体的重复测量次数十分有限,且个体之间的观测时间点是不整齐的。本项目提出了一种两步条件估计方程的方法,利用随机效应的相依性将纵向信息与复发事件联系在一起。具体的,我们利用传统的Cox比例风险模型对复发事件建模,但加入了随时间变化的随机干扰,同时利用函数型数据常用的随机效应模型对稀疏纵向数据构造模型,以通过“借力”的方式更合理更灵活的刻画纵向信息的相依结构。这一方法应用到一项可卡因吸毒行为的研究当中,发现了吸毒者复吸行为的一些行为模式。第二种数据类型通常会在金融和社交网络当中出现,复发事件出现的多个时间段上,而每个时间段之间又具有一定的相依关系。本项目提出了基于函数型时间序列的Log-Gaussian Cox点过程建模方法,将复发事件背后的点过程与多水平的函数型随机效应联合在一起,并从理论上讨论了模型参数估计量的大样本性质。该建模方法应用在我国三百万个账户在三年期间的每日股票交易数据当中,挖掘了不同板块股票交易行为的特点,并对未来交易行为进行了预测。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
函数型数据的稳健统计推断理论及其应用
多元函数型数据的统计分析及其应用研究
复杂时间序列与函数型数据的统计分析
函数型数据的统计推断