基于实例空间的时间序列预测研究

基本信息
批准号:11701022
项目类别:青年科学基金项目
资助金额:20.00
负责人:康雁飞
学科分类:
依托单位:北京航空航天大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:刘冠男,代员禛,杨红云
关键词:
时间序列实例空间预测方法比较统计计算时间序列重现
结项摘要

Our confidence in the future performance of any algorithm, including time series forecasting algorithms, depends on how carefully we select test instances so that the generalization of algorithm performance on future instances can be inferred. It is common practice to evaluate the strength of forecasting methods using collections of well-studied time series datasets. The question is, though, how diverse and challenging are these time series, and do they enable us to study the unique strengths and weaknesses of different forecasting methods? Noting that the diversity of many benchmarking dataset has been questioned, in this project, we will firstly establish a methodology to generate a two-dimensional instance space, comprising known time series instances. This instance space shows the similarities and differences between the instances using measurable features or properties, and enables the performance of forecasting algorithms to be viewed across the instance space, where generalizations can be inferred. The diversity of the time series in an existing collection can be assessed. Secondly, this project proposes a method for generating new time series with controllable characteristics, by filling observed gaps in the instance space. This enables the generation of rich new sets of time series instances to make generalizations of forecasting method performances as robust as possible. In the end, we obtain insights about algorithm strengths and weaknesses by examining the regions in the instance space where strong or weak performances can be expected.

对于已知算法(如时间序列预测算法)在未来数据的预测信心取决于现有的测试数据是否足以代表未来数据特征。预测者习惯用经典数据集来衡量其时间序列预测方法的好坏。但是这些数据集的所能体现多样性受到越来越多学者质疑。 本项目通过研究时间序列特征如何影响预测方法的选择以回答“为什么文献的算法在实际数据中不凑效”这一问题。首先我们提出针对给定时间序列数据集对其二维实例空间的投影方法。此空间可以揭示时间序列之间的异同以及不同预测方法在此空间各区域的性能表现,并研究数据的多样性。 其次,此项目拟通过实现从特征到时间序列的重现,并在现有实例空间中追加具有更广泛特征分布的实例,以满足数据的多样性,为预测方法的评价提供更丰富更有说服力的数据。最后,本项目在生成的有足够多样性的实例空间中,甄别适合不同区域所对应的最佳预测方法,从而研究时间序列预测方法与特征的映射,并实现时间序列预测方法的自动选择。

项目摘要

在过去半个世纪,预测科学作为一门独立的学科取得了长足发展。计算技术的飞速发展使预测方法的规模和复杂度不断提高。但是因为“No-Free-Lunch”理论指出不存在一个普适的模型,在大数据集时间序列预测的应用场景下,随着大量的预测方法被提出并应用到库存管理、金融市场、经济与农业预测等领域,对于特定时间序列数据的最佳预测技术识别变得尤其重要。由于无论是简单还是复杂的预测方法都与数据的特征相关联,所以就存在一个从时间序列特征与预测方法有效性的映射,本研究重点围绕基于时间序列特征的预测开展了一系列理论和应用研究。首先,本项目指出了时间序列传统特征应用于预测问题中的局限性,首次提出使用时间序列图像、基于预测值多样性等自动化的特征提取进行时间序列预测,系统研究了时间序列的特征提取理论框架。基于此框架及混合自回归模型提出了可以生成具有多样化特征的时间序列数据集,从而创建一个可以稳健体现不同预测方法有效应的实例空间,为预测者探索他们的预测方法提供有力依据。其次,本项目提出了一个高效的从低维实例空间到高维时间序列的重现机制,能够为已有的时间序列进行人工扩容,不但增加数据的多样性、降低数据生产成本,而且为预测方法的精度测试提供更多更有利的依据,这在真实数据有限或者数据生产成本高的情况下显得极为重要。最后,基于上述关于时间序列特征及实例空间,开展不同单一预测模型的模型选择和模型组合研究。现有的基于时间序列特征的预测研究大都局限于点预测研究,少有文献研究基于特征的预测不确定估计,但是因为在实践中对预测不确定性的准确估计可以支持库存和供应链管理中的决策以及有效地设置安全库存,有助于更有效地运筹管理,因此本项目分别从点预测、区间预测和概率预测这三个方向深入开展了点预测及其不确定估计研究。本研究提出影响基于特征的时间序列预测的因素主要有三个方面:(1)训练集的多样性,(2)特征的全面性,(3)特征与预测精度之间模型的可靠性。从这三个方面出发,本项目系统并深入研究了基于特征的点预测,并完善基于特征的点预测理论体系;提出一系列区间预测和概率预测新技术,均取得了很好的应用效果,推动了预测不确定性估计的理论进展。本项目按照任务书要求完成了预期目标,为处理经济、金融、能源、零售等领域中的时间序列预测问题提供了一系列先进的理论成果和有效的技术工具,研究不仅具有重要的理论意义,同时具有迫切的现实意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020

康雁飞的其他基金

相似国自然基金

1

空间时间序列模型预测矿井突水机理研究

批准号:40472146
批准年份:2004
负责人:杨永国
学科分类:D0213
资助金额:30.00
项目类别:面上项目
2

多元混沌时间序列预测及其在空间上的扩展

批准号:61702077
批准年份:2017
负责人:许美玲
学科分类:F06
资助金额:25.00
项目类别:青年科学基金项目
3

基于时间序列挖掘的阶段式异常预测研究

批准号:61672161
批准年份:2016
负责人:张彦春
学科分类:F06
资助金额:64.00
项目类别:面上项目
4

基于信息几何的时间序列表示与回归及预测研究

批准号:60602034
批准年份:2006
负责人:孙建成
学科分类:F0111
资助金额:20.00
项目类别:青年科学基金项目