基于众数的函数型数据聚类方法

基本信息
批准号:11901522
项目类别:青年科学基金项目
资助金额:24.00
负责人:郭佳
学科分类:
依托单位:浙江工业大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
非参数密度众数聚类空间数据聚类分析数据降维
结项摘要

In recent decades, functional data has received increasing attention and functional data clustering is successfully and widely used in economics, meteorology and many other fields. However, most existing clustering methods for functional data are extensions of traditional K-means clustering and model-based clustering. Their drawbacks, such as requiring a pre-given number of clusters and strict assumptions of parameters, limit their applications. Nonparametric modal clustering method to be studied in the project not only overcomes the drawbacks of the above methods, but also performs well when different clusters have very different variances, which can provide new ideas for complicated practical problems. Previous functional data clustering methods usually reduce the data dimension by projection first, then use the projected data for cluster analysis. In this project, cluster analysis and dimension reduction are performed simultaneously to find a procedure that constructs a low-dimensional representation of functional data such that the cluster structure in the data is maximally revealed, which greatly improves the accuracy of clustering. This project will also extend the nonparametric modal clustering method to multi-dimensional functional data, functional data with spatial information and so on, and consider applying modal regression to clustering, hoping to find new research directions of functional data clustering.

近几十年来,函数型数据得到了越来越多的关注,函数型数据的聚类分析也被广泛应用于经济学、气象学等领域,并取得了一定的成绩。然而,当前的文献大都是对传统K均值聚类和基于模型的聚类等方法的推广和改进,这些方法的缺点如需要猜测聚类数目、参数假设过于严格等,限制了它们在一些实际问题中的应用。本项目拟研究的基于众数的函数型数据聚类方法将克服上述方法的缺点,且对簇与簇之间方差差异很大的数据表现良好,为解决复杂多变的实际问题和不断扩展的应用提供新的思路。以往的函数型数据聚类方法一般先将数据降维,再利用降维后的数据做聚类分析。本项目则将函数型数据降维与聚类分析相结合,不仅可以找出最大化函数型数据聚类特征的最优降维空间,还提高了聚类的精确性。本项目还将基于众数的聚类方法推广到多维函数型数据、带有空间相关性的函数型数据等,并考虑将基于众数的回归模型应用到函数型数据聚类,进一步开拓函数型数据聚类分析新方向。

项目摘要

近几十年来,函数型数据得到了越来越多的关注,函数型数据的聚类分析也被广泛应用于经济学、气象学、社会学等领域。然而,当前的研究大都是对传统K均值聚类和基于模型的聚类等方法的推广和改进,这些方法的缺点如需要猜测聚类数目、参数假设过于严格等,限制了它们在一些实际问题中的应用。本项目拓展了多维函数型数据的系统聚类法和K均值聚类法,并建立了基于众数的函数型数据聚类方法。本项目提出的基于众数的聚类法克服了系统聚类法和K均值聚类法的很多缺点,且对簇与簇之间方差差异很大的数据表现良好。以往的函数型数据聚类方法一般先将数据降维,再利用降维后的数据做聚类分析。本项目则将函数型数据降维与聚类分析相结合,不仅可以找出最大化函数型数据聚类特征的最优降维空间,还提高了聚类的精确性。最后,本项目将所建立的聚类方法应用到我国33个城市可持续发展潜力的评估和我国70家电子设备制造业上市企业创新能力的评价。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019

郭佳的其他基金

批准号:81403252
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:31501751
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:41605093
批准年份:2016
资助金额:23.00
项目类别:青年科学基金项目
批准号:21474015
批准年份:2014
资助金额:40.00
项目类别:面上项目
批准号:81702539
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:81600256
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:21774023
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:81873107
批准年份:2018
资助金额:56.00
项目类别:面上项目
批准号:21004012
批准年份:2010
资助金额:24.00
项目类别:青年科学基金项目
批准号:81400726
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81502901
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:11801450
批准年份:2018
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

基于缺失属性值区间型描述的不完备数据聚类方法及应用研究

批准号:61305034
批准年份:2013
负责人:李丹
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
2

高维数据的函数型数据(functional data)分析方法

批准号:11001084
批准年份:2010
负责人:周迎春
学科分类:A0402
资助金额:16.00
项目类别:青年科学基金项目
3

基于多视图学习的癌症多组学数据聚类方法研究

批准号:61906198
批准年份:2019
负责人:刘健
学科分类:F0603
资助金额:22.00
项目类别:青年科学基金项目
4

基于约束的高维数据聚类

批准号:61272374
批准年份:2012
负责人:张宪超
学科分类:F0607
资助金额:80.00
项目类别:面上项目