时间序列的shapelets表示及其分类学习模式研究

基本信息
批准号:61672086
项目类别:面上项目
资助金额:62.00
负责人:王志海
学科分类:
依托单位:北京交通大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:丁丁,刘海洋,原继东,付彬,张伟,江晶晶,白洋,张志东,徐惊秋
关键词:
分类分类器时间序列数据挖掘算法Shapelets
结项摘要

Time series data exists widely in almost every field of our daily life. Time series shapelets are considered as the most discriminative subsequence of time series because of updated continually, no explicit descriptive features, high dimensionality, and lack of classification interpretability etc. Based on representation of time series shapelets, firstly, the project will research on the methods of representation of time series shapelets, and dependent relationship among shapelets. Then, it will focus on the relationship between the representation of time series shapelets and classification learning scheme, and how to improve classification accuracy, whilst retaining their interpretability. Thirdly, it will probe into transformation methods of time series shapelets, and their pruning and coverage methods. Finally, it will investigate into lazy classification schemes by mining and using association rules on time series datasets with shapelets representation, as well as, local weighted classification scheme based on efficient and effective dynamic time warping techniques. These research results are greatly helpful for building high-quality representation of time series shapelets, and high effective generation process, clarify classifier construction of interpretability time series and classification process, and promote the classification accuracy of time series. Meanwhile, it should be an important step for solving a problem of real domain.

时间序列数据几乎广泛存在于日常生活中的每个应用领域。时间序列分类学习由于其数据时效性、无明确描述性特征、空间维度高,模型缺乏解释性等面临诸多挑战。shapelets是一个时间序列之中最具有辨别性的子序列。本项目以时间序列的shapelets表示为基础,首先,研究时间序列的shapelets表示及其之间的依赖关系;其次,研究shapelets表示与分类模式之间的关系,以及如何将时间序列的分类问题转化为经典分类问题的方法,并保持其可解释性;第三,研究时间序列的shapelets转换技术,以及有效的剪枝和覆盖方法;最后,研究基于关联规则的懒惰式分类模式,以及基于动态时间弯曲技术的局部加权分类模式等。本项目的研究可以建立高质量的shapelets表示形式及其高效的生成过程,从多种角度阐明可解释性时间序列分类器的构造和分类过程,提升时间序列分类准确性,同时也为解决实际应用问题奠定良好的基础。

项目摘要

时间序列分类学习由于其数据时效性、无明确描述性特征、空间维度高,模型缺乏解释性等面临诸多挑战。本项目主要研究shapelets表示机制的构建和分类算法,时间序列数据流的概念漂移检测体系,辨别性模式的应用等,以期提升序列模型的性能与可解释性。.基于shapelets的时间序列表示和分类算法具有可解释性强,分类速度快,准确率高等优点。主要相关研究内容和成果包括提出懒惰式shapelets发现的思想,基于Pairwise Shapelets的随机森林模型,根据局部加权DTW发现辨别性模式,基于Logistic回归的shapelet字典学习等。对应研究论文已发表在CCF推荐的中英文期刊和会议上,如PAKDD 2018,CIKM 2019,KAIS,计算机学报,软件学报等。.时间序列数据具有不断演化,非平稳性,概念漂移和概念重复等特点。为有效处理和适应此类数据,提出了基于频繁模式和显露模式的数据流贝叶斯分类器,基于图模型的概念发现与漂移检测算法,基于信息熵的概念漂移检测自适应集成算法等。对应研究论文已发表在国内外著名SCI/EI期刊上,如Neurocomputing,CIN,IAJIT,ICONIP 2017,软件学报等。.另外,尝试拓展辨别性模式的研究边界,针对不同种类的时间序列数据及其应用问题进行探索研究。比如,研究了基于辨别性特征的恶意代码检测,基于选择性模式的贝叶斯分类算法;基于ReliefF剪枝的多标记时间序列分类方法;探索了序列模式在蛋白质和疾病预测,行人重识别,云资源的调度和推荐中的应用等。对应研究论文已发表在CCF推荐的中英文期刊和会议上,如NCAA,IEEE-ACM TCBB,FGCS,PRICAI 2018,计算机学报,软件学报,计算机研究与发展等。.本项目发表期刊和会议论文共46篇,其中SCI检索论文15篇,CCF推荐英文期刊/会议论文和A类中文期刊论文共18篇,资助参加了11次国内外著名会议。培养4名博士和20名硕士研究生毕业。.综上所述,该项目的主要进展和重要研究结果主要在于针对时间序列的shapelets表示机制与分类模型,流数据的概念漂移检测机制进行研究,扩展和丰富了相关问题的外延和内涵,对本领域的研究人员有一定的借鉴作用。应用前景方面,项目组成员正尝试将所提出算法用于多光谱/高光谱时间序列分析,MOOC学习行为预测和智慧农业物联网数据等。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
4

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

王志海的其他基金

批准号:81902776
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目
批准号:60673089
批准年份:2006
资助金额:28.00
项目类别:面上项目

相似国自然基金

1

基于时间序列Shapelets的u-Health心电图可解释早期分类研究

批准号:61702468
批准年份:2017
负责人:李桂玲
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
2

基于相似性的时间序列表示与模式发现理论和方法研究

批准号:50205009
批准年份:2002
负责人:刘世元
学科分类:E0503
资助金额:20.00
项目类别:青年科学基金项目
3

形状的语义结构表示及其分类学习研究

批准号:61173131
批准年份:2011
负责人:张小洪
学科分类:F0605
资助金额:55.00
项目类别:面上项目
4

基于辨别性模式的时间序列分类及其在可穿戴设备中的应用研究

批准号:61702030
批准年份:2017
负责人:原继东
学科分类:F0607
资助金额:25.00
项目类别:青年科学基金项目