In functional data analysis, functional data are often assumed to be fully and independently observed for every subject. However, in dealing with real data, we are often faced with the scenario that some functional data are fully observed and others are incompletely observed. Furthermore, the functional samples with dependent observation are often encountered. For example, air pollution monitoring for different station in the same city. The purpose of this project is, firstly, propose a test statistics which can test the equivalences of mean function and covariance function for incompletely observed functional data and investigate the asymptotic behaviors of the statistics. The proposed methods are applied to an air pollution study in a city of western region. Of interest is to test if the pollution level of working and non-working days or four seasons in this city are significantly different. Secondly, the proposed methods are extended to two sample test of high dimensional data with missing data and applied to the cardiomyopathy microarray dataset. Finally, a feasible test statistics are proposed for the test of two samples with dependent and incompletely observed functional data. The air pollution data are analyzed again and a comprehensive evaluation of the pollution level is obtained by the data of different monitoring station in this city.
在函数型数据分析中,经常假定每个函数型数据有完全观测且每个函数型数据的观测是相互独立的,但在实际生活中,一些函数型数据有完全观测而另一些函数型数据只有部分观测,此外,相依函数型数据样本也经常遇到,如:同一城市的不同观测站的大气污染观测。本文拟: (1) 对带有不完全观测的函数型数据两样本问题提出一个可行的检验统计量,即:检验两个样本的平均函数和协方差函数是否相同,考察其渐近分布,并将发展的方法应用到西部地区某城市的大气污染数据中,分别检验工作日和非工作日,四个季节的污染是否有显著的差异。(2)将在函数型数据中发展的两样本检验方法推广到带有缺失的高维数据的检验问题,将推广的方法应用到心肌病基因芯片数据集。(3)对带有不完全观测的相依函数型数据的两样本问题提出一个可行的检验统计量,并进一步的分析大气污染数据,综合利用不同观测站的数据对整个城市的污染水平做出一个综合评价。
函数型数据和高维数据是当今社会多个领域经常碰到的数据类型,能否有效的对其进行统计推断具有非常重要的意义。本项目主要在函数型数据的检验、函数型数据的建模、函数型数据的模型选择以及高维数据的检验四方面开展研究。对函数型数据的检验,开展了以下工作。首先,我们研究了一部分函数型数据完全观测,一部分函数型数据不完全观测的两样本检验问题,我们提出了一种新的投影方法来检验两样本平均函数是否相等,提出了检验统计量,并证明了该统计量在零假设下服从卡方分布,我们也证明了检验的相合性;对带有不完全观测的相依函数型数据的平均函数的检验,我们提出了剖面检验和全局检验。针对函数型数据的建模,我们提出了基于函数奇异元分析的函数可加模型,该模型提供了一种分析函数响应与函数协变量之间的关系的灵活工具,我们分别证明了模型中非参数函数和拟合函数的估计的相合性;我们也提出了函数二次乘积模型,对此模型我们提出了该模型的完全相对误差估计。对函数型数据的模型选择问题,我们提出了部分函数多项式模型、部分函数多项式乘积模型和带有自回归误差的函数多项式模型的模型探测问题。最后,利用函数型数据的两样本检验方法,我们提出了不完全观测高维数据的两样本检验,并对方法的大样本理论性质给出了完整严谨的证明。总的来说,我们顺利完成了本项目的既定目标,并在本项目的支持下共完成14篇论文。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
拥堵路网交通流均衡分配模型
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
低轨卫星通信信道分配策略
高维函数型数据的检验、回归与分类
函数型数据的检验问题
高维数据的函数型数据(functional data)分析方法
高维数据检验问题中的稀疏方法及其应用