The project is related to similar patterns mining for multivariate time series, which is becoming a hot topic in the area of data mining. Dynamic time warping is a much more robust distance measure for multivariate time series; however it does not obey the triangular inequality and has high computational complexity, thus it has resisted attempts at similarity search. A kind of subsequence search method for multivariate time series under dynamic time warping distance is proposed, which can extend search object from univariate time series to multivariate time series in the area of similar pattern mining. The prospective achievements of the project have important theory significance and practical values in flight training evaluation, aided fault dignosis and flight data analysis. Related technology can be used in stock analysis, video retrieval, internet situation monitoring and so on.
本项目瞄准数据挖掘领域的研究热点——多元时间序列相似模式挖掘,针对DTW距离计算复杂度较高、不支持距离三角不等式、造成序列相似性搜索困难的问题,系统地提出一套支持DTW距离度量的多元子序列相似性搜索方法。能够以DTW距离作为相似性度量方法,高效地实现多元子序列的相似性搜索,为促进相似模式挖掘从一元时间序列向多元时间序列的拓展提供理论依据和技术支撑。预期研究成果可为飞行训练质量评估、辅助故障诊断、飞行数据分析与处理提供新的技术途径,相关技术可为股市分析、视频检索、互联网事态监控等应用领域提供借鉴。
时间序列是一种普遍存在的数据类型,广泛存在于经济、政治、文化、医疗、交通、国防等各个领域,随着时间的推移,存储规模呈现爆炸式增长。时间序列数据挖掘旨在探索隐含在海量时间序列之中的深层知识,在图像识别、语音处理、声纳技术、遥感技术等工程技术领域以及金融分析、人口统计等社会经济领域中都具有广阔的应用前景。.本项目在研究多元时间序列相似模式挖掘一般方法理论的基础上,结合飞行数据的特点,探寻一种能高效地搜索用户感兴趣飞行数据模式的方法。在系统梳理多元时间序列相似性搜索研究现状的基础上,重点研究了多元时间序列的缺失数据填补、相似性度量、相似模式搜索等几个方面,提出了一些新算法和解决方案,主要工作和研究成果包括:.1.研究了多元时间序列缺失数据填补方法。.首先,针对存在缺失数据的序列,搜索与其同类的相似序列,构建训练集;然后,利用最小二乘支持向量机,分别进行多变量填补和单变量填补;而后,根据多变量和单变量填补结果的差异度,提出了一种组合阈值填补方法。最后,对所提方法进行了实验验证,结果表明,它具有较高的填补精度、且适用于缺失数据较多的场合。.2.研究了多元时间序列相似性度量方法。.首先,对多元时间序列进行多维分段拟合;然后,选取各分段上序列点的均值作为特征;最后,以特征序列作为输入,利用动态时间弯曲算法实现相似性度量。实验结果表明,本文所提方法参数配置简单,能够在保证度量准确性的前提下,有效降低计算复杂度。.3.研究了多元时间序列相似模式搜索方法。.首先,构造一种计算代价较低的DTW下界距离,用其进行粗略过滤、得到候选集;而后,利用提前终止策略,优化计算候选集中序列的DTW距离,得到搜索结果;最后,对所提方法进行了实验验证,结果表明,该方法能够提高DTW距离的相似性搜索效率,且具有非漏报性。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
内点最大化与冗余点控制的小型无人机遥感图像配准
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多元时间序列数据挖掘中的特征表示和相似性度量方法研究
Web搜索与挖掘的新理论和新方法—支持舆情监控的Web搜索与挖掘的理论与方法研究
基于距离衰减效应的加权同位模式挖掘方法研究
支持快速相似检索的高维度量空间索引技术研究