探索多属性变化特征的三向聚类方法及其可视化

基本信息
批准号:41901317
项目类别:青年科学基金项目
资助金额:27.00
负责人:吴晓静
学科分类:
依托单位:中国科学院地理科学与资源研究所
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
空气污染因子三向聚类时空数据立方体多属性变化特征时空可视化
结项摘要

Clustering analysis can be used to extract useful information from large amounts of spatio-temporal data. Multi-attribute spatio-temporal data is typically organized in the space-time cube for the further analysis where rows indicate locations, columns indicate timestamps and depth indicate attributes. However, current one-way clustering, co-clustering and tri-clustering methods are unable to identify similar attributes changing characteristics in the cube. In this study we are going to develop a tri-clustering method that can identify similar attributes changing characteristics in the cube, and then choose and design visualizations to analyze the complex patterns of multi-attribute changes along both space and time dimensions. To be specific, we will develop a new tri-clustering algorithm that can identify similar attributes changing characteristics based on an existing tri-clustering algorithm for similar attribute values and co-clustering algorithm for similar attribute changing characteristics. Then, we are going to choose and also design visualizations to display the tri-clustering results. Finally, we will use national air pollutants concentration data as the case study and apply both new tri-clustering algorithm and visualizations to it. The developed tri-clustering method and its visualizations can be used to analyze patterns of multi-attribute changes along both space and time dimensions, and therefore help to better understand complex patterns in spatio-temporal data.

聚类方法已广泛用于提取海量时空数据中的有用信息。多属性时空数据通常被组织在数据立方体中以便于分析。现有单向、双向和三向聚类方法无法识别时空数据立方体中多属性变化特征相似的三向聚簇,因此不能分析多属性同时随时空变化的模式。本项目将发展一个用于分析数据立方体中多属性变化特征相似的三向聚类方法,并选择和设计可视化方法来展示聚类结果中多属性同时随时空变化的模式。具体来说,本项目首先将结合分析属性值相似的三向聚类算法和属性变化特征相似的双向聚类算法来发展新的三向聚类算法用于识别多属性变化特征相似的三向聚簇;其次,本项目将选择和设计可视化方法对三向聚簇进行图形化表达用于展示多属性同时随时空变化的模式;最后,本项目将使用新三向聚类算法和可视化方法分析全国空气污染因子浓度数据。本项目发展的三向聚类算法及其可视化方法能够分析时空数据立方体中多属性同时随时空变化的模式,从而帮助更好的理解时空数据中的复杂模式。

项目摘要

地学领域产生了前所未有的海量数据,聚类分析可以有效地挖掘出隐藏在大量时空数据中的复杂模式。然而无论是单向聚类还是双向聚类方法都无法对组织在数据立方体中的时空数据进行一体化的聚类分析。而现有的三向聚类方法仅能识别出属性值相似的三向聚簇而无法找出属性变化特征相似的聚簇。因此,本项目发展了一个新的用于分析时空数据立方体中多属性变化特征相似的三向聚类算法,进一步选择和设计能够有效展示三向聚类结果中多属性同时随时空变化模式的可视化方法,从而帮助更好的理解多属性时空数据中复杂的时空变化模式,并将发展的三向聚类算法和可视化方法应用于分析全国多种空气污染因子同时随时空变化的模式。项目研究结果发现:(1)新发展的Bregman tri-clustering algorithm with minimum sum-squared residue (BCC_MSSR) 算法能够成功的用于识别任何实值数据矩阵中具有相似变化特征的三向聚簇;(2)并列地图、二维和近似三维热力图、环形时间线等可视化方法能够有效地展示多属性时空数据中复杂的时空变化模式;(3)结合BCC_MSSR算法和上述可视化方法能够有效地分析空气污染因子随时空变化的复杂模式,即空气污染物及其之间关系的时空异质性。比如,除O3外,空气污染物浓度的空间变化为南方城市低北方城市高,季节性变化为夏季低冬季高;在污染程度较高的北方城市,因为NO2的氧化反应,从夏季到冬季随着NO2浓度的增加,O3的浓度先下降,然后从秋季到冬季浓度又有所增加。上述研究结果对于认识聚类分析的作用以及理解海量时空大数据中的复杂模式很有意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

近 40 年米兰绿洲农用地变化及其生态承载力研究

近 40 年米兰绿洲农用地变化及其生态承载力研究

DOI:
发表时间:2020
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

DOI:10.5846/stxb201912262800
发表时间:2020

相似国自然基金

1

基于特征聚类的高维混合属性数据特征选择方法

批准号:61806131
批准年份:2018
负责人:贾红
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
2

矢量场特征可视化与流形聚类研究

批准号:60903120
批准年份:2009
负责人:李宏宇
学科分类:F0214
资助金额:17.00
项目类别:青年科学基金项目
3

云聚类多属性决策桥梁工程风险评估方法

批准号:51608119
批准年份:2016
负责人:彭可可
学科分类:E0810
资助金额:20.00
项目类别:青年科学基金项目
4

异构多属性网络的多视图聚类关键技术研究

批准号:61572158
批准年份:2015
负责人:叶允明
学科分类:F0205
资助金额:64.00
项目类别:面上项目