高维时间序列数据聚类分析及应用研究

基本信息
批准号:71771094
项目类别:面上项目
资助金额:47.00
负责人:李海林
学科分类:
依托单位:华侨大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:邓晓懿,王伟,郭韧,张丽萍,梁叶,魏苗,邹金串,邬先利
关键词:
数据挖掘时间序列聚类分析数据降维高维性
结项摘要

Time series is a common data object in the field of economic management, which not only includes the high dimensional characteristics such as time dimension, attribute variables and data volume, also has dynamic, uncertainty and high noise and other factors. All those make the research have more theoretical meaning and practical value for getting the labels of high dimensional time series data through the unsupervised machine learning clustering methods. First of all, the project intends to focus on data dimensionality reduction, feature representation, similarity measurement, clustering models and algorithms from the different perspective of time series data with high dimensionality, which makes the whole process of clustering analysis have the calculation efficiency and good learning effect. Secondly, considering the influence of the factors, such as real-time dynamic, uncertain and high noise, the corresponding solutions and strategies are proposed to improve the robustness of the models and algorithms used by clustering analysis. In addition, based on different high dimensional features and influence factors of time series data, clustering methods are applied to other mining tasks and methods. Moreover, it combines with the actual background of financial markets and industrial engineering to test and modify the clustering algorithms and to find the information and knowledge hidden in concrete industry. Meanwhile, it provides more mature theoretical basis and technical support for government departments and enterprise managers so as to realizes the scientific and reasonable intelligent decision-making and management.

时间序列是经济管理领域中常见的一种数据对象,其不仅包含了时间维度、属性变量和数据体量等高维性特征,还具有实时动态、不确定性和高噪声等影响因素,使得通过无监督机器学习聚类方法来获取高维时间序列数据类别标签的研究更具有理论意义和实践价值。首先,本项目拟从不同的维度视角来着重研究高维时间序列的数据降维与特征表示、相似性度量和聚类模型与算法,使得整个聚类分析过程与结果具有良好的计算效率和学习效果。其次,考虑时间序列数据实时动态、不确定性和高噪声等因素给聚类结果带来的影响,提出相应的解决方案和策略,提升模型和算法的鲁棒性。此外,将基于不同高维特征和影响因素的时间序列数据聚类运用于其它挖掘任务和方法,并结合金融市场和工业工程等实际领域背景来检验和修正聚类模型与算法并用于发现隐藏在具体行业中的信息与知识,为政府部门和企业管理者提供更为完备成熟的理论基础与技术支持,进而实现科学合理的智能决策和管理。

项目摘要

高维时间序列数据的聚类是时间序列的数据表达、特征提取、相似性度量等知识管理领域的重要基础工作,运用数据挖掘方法分析高维时间序列数据蕴含的知识与信息成为了数据分析领域中具有前瞻性和实用性的主流研究方向。然而在大数据时代背景下,高维时间序列数据所具有的时间维度长、数据体量大、属性变量多等复杂特征给时间序列数据分析工作带来了极大的挑战,为此本项目从以下几个方面深入展开了研究并取得一定的成效:(1)高维时间序列的数据聚类算法和模型研究。首先,为了丰富和完善后期时间序列聚类分析的理论基础,设计适用于前期数据处理结果的聚类模型与算法,分别从属性加权和聚类数目限定两个角度对近邻传播聚类算法进行了研究,提出了类过程更稳定、聚类结果质量更精确的新型近邻传播算法;另外,根据高维时间序列数据的多维度、多属性的特征,从特征表示、相似性度量、数据降维和变量相关性等角度对时间序列聚类算法进行了研究,对传统时间序列的数据挖掘算法进行改进和优化,大大提高了高维时间序列的聚类效率与质量。(2)高维时间序列数据聚类分析的实际领域应用研究。将高质量的时间序列聚类分析方法应用于经济金融、电子商务及图书情报等学科领域的数据分析,及时发现蕴含在股票数据中的股指期货组合规律、电子商务平台消费数据中的销售模式,以及在期刊文献数据中的主题演化规律和变化趋势,为丰富金融市场投资与管理管理方式、电子商务平台的商品促销管理和期刊文献的主题发现等现实问题提供新的研究思路,同时助力相关领域管理者的知识发现和决策分析。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

李海林的其他基金

相似国自然基金

1

高维时间序列的数据挖掘算法及应用研究

批准号:60773213
批准年份:2007
负责人:冯林
学科分类:F0201
资助金额:25.00
项目类别:面上项目
2

基于高维时间过程型数据的依时间可变聚类分析

批准号:11671073
批准年份:2016
负责人:黄伟
学科分类:A0604
资助金额:48.00
项目类别:面上项目
3

高维整数值时间序列的建模、统计推断及应用研究

批准号:11871027
批准年份:2018
负责人:朱复康
学科分类:A0402
资助金额:53.00
项目类别:面上项目
4

高维序列数据的核学习方法及应用研究

批准号:61672157
批准年份:2016
负责人:陈黎飞
学科分类:F0605
资助金额:60.00
项目类别:面上项目