多元时间序列相似模式挖掘中支持DTW距离度量的子序列搜索方法研究

基本信息
批准号:61502521
项目类别:青年科学基金项目
资助金额:19.00
负责人:李正欣
学科分类:
依托单位:中国人民解放军空军工程大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:李克武,周宇,王博,高杨军,张斯嘉,王丽丽,张小刚
关键词:
动态时间弯曲子序列搜索数据挖掘多元时间序列相似性度量
结项摘要

The project is related to similar patterns mining for multivariate time series, which is becoming a hot topic in the area of data mining. Dynamic time warping is a much more robust distance measure for multivariate time series; however it does not obey the triangular inequality and has high computational complexity, thus it has resisted attempts at similarity search. A kind of subsequence search method for multivariate time series under dynamic time warping distance is proposed, which can extend search object from univariate time series to multivariate time series in the area of similar pattern mining. The prospective achievements of the project have important theory significance and practical values in flight training evaluation, aided fault dignosis and flight data analysis. Related technology can be used in stock analysis, video retrieval, internet situation monitoring and so on.

本项目瞄准数据挖掘领域的研究热点——多元时间序列相似模式挖掘,针对DTW距离计算复杂度较高、不支持距离三角不等式、造成序列相似性搜索困难的问题,系统地提出一套支持DTW距离度量的多元子序列相似性搜索方法。能够以DTW距离作为相似性度量方法,高效地实现多元子序列的相似性搜索,为促进相似模式挖掘从一元时间序列向多元时间序列的拓展提供理论依据和技术支撑。预期研究成果可为飞行训练质量评估、辅助故障诊断、飞行数据分析与处理提供新的技术途径,相关技术可为股市分析、视频检索、互联网事态监控等应用领域提供借鉴。

项目摘要

时间序列是一种普遍存在的数据类型,广泛存在于经济、政治、文化、医疗、交通、国防等各个领域,随着时间的推移,存储规模呈现爆炸式增长。时间序列数据挖掘旨在探索隐含在海量时间序列之中的深层知识,在图像识别、语音处理、声纳技术、遥感技术等工程技术领域以及金融分析、人口统计等社会经济领域中都具有广阔的应用前景。.本项目在研究多元时间序列相似模式挖掘一般方法理论的基础上,结合飞行数据的特点,探寻一种能高效地搜索用户感兴趣飞行数据模式的方法。在系统梳理多元时间序列相似性搜索研究现状的基础上,重点研究了多元时间序列的缺失数据填补、相似性度量、相似模式搜索等几个方面,提出了一些新算法和解决方案,主要工作和研究成果包括:.1.研究了多元时间序列缺失数据填补方法。.首先,针对存在缺失数据的序列,搜索与其同类的相似序列,构建训练集;然后,利用最小二乘支持向量机,分别进行多变量填补和单变量填补;而后,根据多变量和单变量填补结果的差异度,提出了一种组合阈值填补方法。最后,对所提方法进行了实验验证,结果表明,它具有较高的填补精度、且适用于缺失数据较多的场合。.2.研究了多元时间序列相似性度量方法。.首先,对多元时间序列进行多维分段拟合;然后,选取各分段上序列点的均值作为特征;最后,以特征序列作为输入,利用动态时间弯曲算法实现相似性度量。实验结果表明,本文所提方法参数配置简单,能够在保证度量准确性的前提下,有效降低计算复杂度。.3.研究了多元时间序列相似模式搜索方法。.首先,构造一种计算代价较低的DTW下界距离,用其进行粗略过滤、得到候选集;而后,利用提前终止策略,优化计算候选集中序列的DTW距离,得到搜索结果;最后,对所提方法进行了实验验证,结果表明,该方法能够提高DTW距离的相似性搜索效率,且具有非漏报性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

李正欣的其他基金

相似国自然基金

1

多元时间序列数据挖掘中的特征表示和相似性度量方法研究

批准号:61300139
批准年份:2013
负责人:李海林
学科分类:F0607
资助金额:23.00
项目类别:青年科学基金项目
2

Web搜索与挖掘的新理论和新方法—支持舆情监控的Web搜索与挖掘的理论与方法研究

批准号:60933005
批准年份:2009
负责人:方滨兴
学科分类:F0210
资助金额:200.00
项目类别:重点项目
3

基于距离衰减效应的加权同位模式挖掘方法研究

批准号:41701440
批准年份:2017
负责人:禹文豪
学科分类:D0114
资助金额:26.00
项目类别:青年科学基金项目
4

支持快速相似检索的高维度量空间索引技术研究

批准号:60873039
批准年份:2008
负责人:曹奎
学科分类:F0202
资助金额:29.00
项目类别:面上项目