High-dimensional nonlinear dependent counting data is widely used in various fields of production and life, such as the number of unemployed people in multiple cities nationwide, the volumes of multiple stocks per minute, etc. Because of the high dimensionality, threshold and dependence of the data, many problems arise when fitting such data with traditional linear time series models. Modeling such data becomes a difficult problem in data analysis, and more and more scholars are beginning to pay attention to the modeling of complex high-dimensional data. Based on the characteristics of the data, this project proposes three kinds of high-dimensional threshold time series models. Firstly, it discusses the properties of the new models, and gives the conditions of the stationarity, ergodicity and identifiability of the models; Secondly, discusses the parameter estimation problems, and gives the numerical algorithms of high-dimensional case and the asymptotic properties of the estimators; Thirdly, studies the test problems of the models, and gives the test methods of checking whether the threshold of the model exists, and whether the coefficient matrix is affected by the covariates; Finally, the proposed models are applied to data analysis in the areas of economics, finance and medicine, and provides a theoretical reference for characterizing economic laws and analyzing the causes of diseases.
高维非线性相依计数数据广泛存在于生产生活的各个领域。例如全国多个城市每月的失业人数、多只股票每分钟的成交量等。由于数据本身具有高维度、阈值性和相依性等特点,用传统的线性时间序列模型来拟合此类数据会出现许多问题。对此类数据的建模成为数据分析的一个难点,越来越多的学者开始关注复杂高维数据的建模问题。本项目从数据的自身特点出发,提出三类高维门限时间序列模型。首先,讨论新模型的性质,给出模型的平稳性、遍历性和识别条件;其次,讨论模型参数的估计问题,给出高维情形的数值算法和估计量的大样本性质;再次,研究模型的检验问题,给出模型的门限是否存在以及系数矩阵是否受到协变量影响等问题的检验方法;最后,将所建立的模型应用于经济、金融和医学等领域的数据分析之中,为刻画经济规律、分析疾病成因等问题提供理论参考。
本项目按照任务书中工作安排,有条不紊地开展研究,得到了一系列研究成果,出色地完成了各项研究内容。具体如下:针对常系数高维整数值门限自回归模型的统计推断问题,我们基于矩阵稀疏算子,提出了两类高维整数值门限自回归模型以及一类高阶整数值门限自回归模型,并分别在不同新息序列假设下研究了模型的参数估计问题,讨论了估计量的极限性质,给出了检验模型门限特征的检验统计量,并将模型应用于不同类型的犯罪活动数据的拟合之中;针对协变量驱动的高维整数值门限自回归模型的统计推断问题,提出了三类受协变量驱动的整数值自回归模型,讨论了所提模型存在平稳遍历解的条件,解决了模型参数估计问题,给出了估计量的渐近分布。此外,还讨论了一类带解释变量的分位数自回归模型的贝叶斯变量选择问题;并且将模型应用于传染病、共享单车租赁次数等数据的拟合之中,得到了有意义的结论;针对带时滞的双门限高维整数值自回归模型的统计推断问题,提出了高维时滞整数值自回归模型和二项时滞整数值自回归模型,在隐马尔可夫模型框架下,讨论了模型的平稳遍历性问题,进一步解决了模型参数的估计问题,推导了估计量的渐近性质。同时,基于贝叶斯经验似然方法解决了两类自回归模型的估计、定阶和系数压缩问题。关于应用研究方面,将高维整数值时间序列模型应用于经济、金融、医疗、犯罪等领域的数据分析之中,进行了相应的预测分析,得到了一系列有意义的结果。本项目所涉及的模型应用广泛,所以本项目有着较好的理论意义和应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
基于LASSO-SVMR模型城市生活需水量的预测
相依数据下自回归模型的稳健统计推断及其应用
高维数据下多因变量回归模型的统计推断
高维时间序列因子自回归模型的统计推断及应用研究
相依回归模型与扩散过程的统计推断及其应用