基于函数型数据分析的联合统计建模:理论与应用

基本信息
批准号:11401013
项目类别:青年科学基金项目
资助金额:22.00
负责人:黄辉
学科分类:
依托单位:北京大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:郭斌,殷云剑,王莹
关键词:
联合建模条件估计方程纵向数据函数型数据分析复发事件
结项摘要

The joint modeling of survival data and longitudinal data has been a hot topic in statistical research in recent years. It has been widely used in many scientific investigations such as biomedical researches. In realistic problems, however, the complexity of data structure may lead to inefficient statistical inferences by existing methods. In this project, we will introduce techniques of Functional Data Analysis into the framework of joint modeling, and extend existing methodologies to a new area. By thinking about data from a functional point of view, we will propose several data-adaptive methods to characterize the trajectory pattern and correlation structure of both longitudinal data and recurrent event point processes. Our methods will be based on different semi- and non-parametric approaches, such as generalized linear mixed model, functional principal component analysis, etc. Asymptotic properties will be studied accordingly. In the meantime, the performance and effectiveness of our method will be demonstrated by extensive simulation studies and data analysis. The proposed methods will also be applied in an analysis of public health problem.

生存数据与纵向数据的联合统计建模近年来成为统计学研究热点,并广泛应用于生物医学等众多科研领域中。然而在处理实际问题时,数据的复杂结构可能会导致现有方法在统计推断方面不够有效。本课题拟在前人的工作基础上,引入函数型数据分析的技术,将联合统计建模方法拓展到一个新的领域。在理论研究方面,我们从函数型数据的角度出发,利用广义线性混合效应模型和函数主成分分析等半参数与非参数的方法,对纵向信息和复发事件点过程的轨迹模式和相关性结构提出数据自适应的建模理论,并深入研究其大样本性质。同时,本课题还将通过大量计算机模拟与数据分析验证所提建模方法的有效性,并将其实际应用在公共卫生领域的研究中。

项目摘要

生存数据和纵向数据在很多科学领域,尤其是生物医学领域,都是非常常见的数据类型。在传统的统计学当中,分别针对生存数据和纵向数据的建模与分析,已经有了非常广泛并且深入的研究,但是将两种数据类型联合在一起进行建模的相关技术,最近二十年才逐渐发展起来,其中以参数或半参数的方法为多,对观测数据的格式和数据内相依结构都有着较强的假设。这些假设在现实的科学数据当中很有可能是不成立的,因此使得现有的许多联合统计建模方法无法在更广泛的范围内使用,或者得出的推断结果存在问题。在本项目中,我们主要考虑了两种数据类型:一种是复发事件(广义的生存数据)与稀疏纵向数据相联系,另一种是复发事件本身具有纵向结构。第一种数据类型在医学和行为学研究中非常常见,当复发事件在较长的时段上出现时,其他变量虽然相应地在较长时段上有纵向观测,但每个个体的重复测量次数十分有限,且个体之间的观测时间点是不整齐的。本项目提出了一种两步条件估计方程的方法,利用随机效应的相依性将纵向信息与复发事件联系在一起。具体的,我们利用传统的Cox比例风险模型对复发事件建模,但加入了随时间变化的随机干扰,同时利用函数型数据常用的随机效应模型对稀疏纵向数据构造模型,以通过“借力”的方式更合理更灵活的刻画纵向信息的相依结构。这一方法应用到一项可卡因吸毒行为的研究当中,发现了吸毒者复吸行为的一些行为模式。第二种数据类型通常会在金融和社交网络当中出现,复发事件出现的多个时间段上,而每个时间段之间又具有一定的相依关系。本项目提出了基于函数型时间序列的Log-Gaussian Cox点过程建模方法,将复发事件背后的点过程与多水平的函数型随机效应联合在一起,并从理论上讨论了模型参数估计量的大样本性质。该建模方法应用在我国三百万个账户在三年期间的每日股票交易数据当中,挖掘了不同板块股票交易行为的特点,并对未来交易行为进行了预测。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

黄辉的其他基金

批准号:50402020
批准年份:2004
资助金额:10.00
项目类别:青年科学基金项目
批准号:81670676
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:30973207
批准年份:2009
资助金额:31.00
项目类别:面上项目
批准号:61774027
批准年份:2017
资助金额:16.00
项目类别:面上项目
批准号:50975099
批准年份:2009
资助金额:35.00
项目类别:面上项目
批准号:61376050
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:51908476
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目
批准号:81202173
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:11871485
批准年份:2018
资助金额:52.00
项目类别:面上项目
批准号:91029742
批准年份:2010
资助金额:50.00
项目类别:重大研究计划
批准号:51375179
批准年份:2013
资助金额:83.00
项目类别:面上项目
批准号:31100321
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:81370837
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:61702376
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:21774130
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:50305006
批准年份:2003
资助金额:23.00
项目类别:青年科学基金项目
批准号:30700304
批准年份:2007
资助金额:17.00
项目类别:青年科学基金项目
批准号:11461080
批准年份:2014
资助金额:36.00
项目类别:地区科学基金项目
批准号:31371016
批准年份:2013
资助金额:75.00
项目类别:面上项目
批准号:51303180
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:60576018
批准年份:2005
资助金额:20.00
项目类别:面上项目
批准号:51107003
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:81170647
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:51608254
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:20673100
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:21574135
批准年份:2015
资助金额:30.00
项目类别:面上项目
批准号:81860252
批准年份:2018
资助金额:34.00
项目类别:地区科学基金项目
批准号:81870506
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:51878336
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:30000194
批准年份:2000
资助金额:18.00
项目类别:青年科学基金项目

相似国自然基金

1

函数型数据的稳健统计推断理论及其应用

批准号:11501018
批准年份:2015
负责人:杜江
学科分类:A0403
资助金额:18.00
项目类别:青年科学基金项目
2

多元函数型数据的统计分析及其应用研究

批准号:11301464
批准年份:2013
负责人:周建军
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目
3

复杂时间序列与函数型数据的统计分析

批准号:11771240
批准年份:2017
负责人:杨立坚
学科分类:A0402
资助金额:48.00
项目类别:面上项目
4

函数型数据的统计推断

批准号:11071120
批准年份:2010
负责人:唐庆国
学科分类:A0402
资助金额:24.00
项目类别:面上项目