Clustering analysis can be used to extract useful information from large amounts of spatio-temporal data. Multi-attribute spatio-temporal data is typically organized in the space-time cube for the further analysis where rows indicate locations, columns indicate timestamps and depth indicate attributes. However, current one-way clustering, co-clustering and tri-clustering methods are unable to identify similar attributes changing characteristics in the cube. In this study we are going to develop a tri-clustering method that can identify similar attributes changing characteristics in the cube, and then choose and design visualizations to analyze the complex patterns of multi-attribute changes along both space and time dimensions. To be specific, we will develop a new tri-clustering algorithm that can identify similar attributes changing characteristics based on an existing tri-clustering algorithm for similar attribute values and co-clustering algorithm for similar attribute changing characteristics. Then, we are going to choose and also design visualizations to display the tri-clustering results. Finally, we will use national air pollutants concentration data as the case study and apply both new tri-clustering algorithm and visualizations to it. The developed tri-clustering method and its visualizations can be used to analyze patterns of multi-attribute changes along both space and time dimensions, and therefore help to better understand complex patterns in spatio-temporal data.
聚类方法已广泛用于提取海量时空数据中的有用信息。多属性时空数据通常被组织在数据立方体中以便于分析。现有单向、双向和三向聚类方法无法识别时空数据立方体中多属性变化特征相似的三向聚簇,因此不能分析多属性同时随时空变化的模式。本项目将发展一个用于分析数据立方体中多属性变化特征相似的三向聚类方法,并选择和设计可视化方法来展示聚类结果中多属性同时随时空变化的模式。具体来说,本项目首先将结合分析属性值相似的三向聚类算法和属性变化特征相似的双向聚类算法来发展新的三向聚类算法用于识别多属性变化特征相似的三向聚簇;其次,本项目将选择和设计可视化方法对三向聚簇进行图形化表达用于展示多属性同时随时空变化的模式;最后,本项目将使用新三向聚类算法和可视化方法分析全国空气污染因子浓度数据。本项目发展的三向聚类算法及其可视化方法能够分析时空数据立方体中多属性同时随时空变化的模式,从而帮助更好的理解时空数据中的复杂模式。
地学领域产生了前所未有的海量数据,聚类分析可以有效地挖掘出隐藏在大量时空数据中的复杂模式。然而无论是单向聚类还是双向聚类方法都无法对组织在数据立方体中的时空数据进行一体化的聚类分析。而现有的三向聚类方法仅能识别出属性值相似的三向聚簇而无法找出属性变化特征相似的聚簇。因此,本项目发展了一个新的用于分析时空数据立方体中多属性变化特征相似的三向聚类算法,进一步选择和设计能够有效展示三向聚类结果中多属性同时随时空变化模式的可视化方法,从而帮助更好的理解多属性时空数据中复杂的时空变化模式,并将发展的三向聚类算法和可视化方法应用于分析全国多种空气污染因子同时随时空变化的模式。项目研究结果发现:(1)新发展的Bregman tri-clustering algorithm with minimum sum-squared residue (BCC_MSSR) 算法能够成功的用于识别任何实值数据矩阵中具有相似变化特征的三向聚簇;(2)并列地图、二维和近似三维热力图、环形时间线等可视化方法能够有效地展示多属性时空数据中复杂的时空变化模式;(3)结合BCC_MSSR算法和上述可视化方法能够有效地分析空气污染因子随时空变化的复杂模式,即空气污染物及其之间关系的时空异质性。比如,除O3外,空气污染物浓度的空间变化为南方城市低北方城市高,季节性变化为夏季低冬季高;在污染程度较高的北方城市,因为NO2的氧化反应,从夏季到冬季随着NO2浓度的增加,O3的浓度先下降,然后从秋季到冬季浓度又有所增加。上述研究结果对于认识聚类分析的作用以及理解海量时空大数据中的复杂模式很有意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
近 40 年米兰绿洲农用地变化及其生态承载力研究
基于多模态信息特征融合的犯罪预测算法研究
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
基于特征聚类的高维混合属性数据特征选择方法
矢量场特征可视化与流形聚类研究
云聚类多属性决策桥梁工程风险评估方法
异构多属性网络的多视图聚类关键技术研究