基于可能世界的不确定数据聚类

基本信息
批准号:61876028
项目类别:面上项目
资助金额:62.00
负责人:张宪超
学科分类:
依托单位:大连理工大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:王智慧,于红,孙茂华,宗林林,张晓彤,刘晗,赵乾利,申华,慕杰
关键词:
可能世界不确定数据一致性原则
结项摘要

Clustering is a typical unsupervised learning method and it plays an important role in accesing knowledge from big data. In recent years, the development of Internet of Things etc. produces large amount of uncertain data, which poses huge challenge on traditional clustering methods. Possible worlds based uncertain data clustering methods not only overcome the inherent difficulties of traditional methods, but also connect seamlessly with uncertain data management models. Howevever, research on this aspect just starts, and there still exists many problems to solve. Based on applicant's previous research, this project proposes that there are three aspects of key problems for possible worlds based uncertain data clustering algorithms: (1) some unnormal possible worlds may cause negative effects on clustering result; (2) existing algorithms ignore the consistency principle among different possible worlds; (3) existing algorithms need the extra post-processing procedures to get the final clustering result. This project will present series of solutions for the three aspects of problems, form systemic theories and methods of possible worlds based uncertain data clustering. The efforts of this project will overcome the unapplicable problem of existing uncertain data clustering algorithms, and provide theorical foundation and technical guarantee for accessing high quality uncertain data clustreing results. The research results will play big roles in many practical application fields such as Internet of Things and so on.

聚类是无监督学习的典型方法,在大数据认知中扮演重要角色。近年来,物联网等的飞速发展产生了大量不确定数据,给传统聚类方法带来巨大挑战。基于可能世界的不确定数据聚类方法不仅能克服传统方法固有的困难,更能和不确定数据管理模型无缝衔接。但是,这方面研究刚刚起步,仍有很多问题亟待解决。本项目在申请人前期研究的基础上,提出基于可能世界的不确定数据聚类算法需要解决三个方面的关键问题:(1)某些异常可能世界会对聚类结果造成负面影响;(2)现有方法忽略了可能世界之间的一致性原则;(3)现有方法需要额外的后处理过程得到最终的聚类结果。本项目针对这三个方面问题提出一系列的解决方案,形成基于可能世界的不确定数据聚类的系统性理论和方法。本项目研究将克服不确定数据聚类现有方法尚不能实际应用的问题,为获得高质量的不确定数据聚类结果提供理论基础和技术保障,将在物联网等实际应用领域发挥重大作用。

项目摘要

近年来,物联网等的飞速发展产生了大量不确定数据,给传统聚类方法带来巨大挑战。基于可能世界的不确定数据聚类方法不仅能克服传统方法固有的困难,更能和不确定数据管理模型无缝衔接。但是,这方面研究刚刚起步,仍有很多问题亟待解决。本项目在申请人前期研究的基础上,提出基于可能世界 的不确定数据聚类算法需要解决三个方面的关键问题:(1)某些异常可能世界会对聚类结果 造成负面影响;(2)现有方法忽略了可能世界之间的一致性原则;(3)现有方法需要额外的后处理过程得到最终的聚类结果。本项目针对这三个方面问题提出一系列的解决方案,形成基于可能世界的不确定数据聚类的系统性理论和方法。本项目研究克服不确定数据聚类现有方法尚不能实际应用的问题,为获得高质量的不确定数据聚类结果提供理论基础和技术保障。最终本项目在不确定数据聚类、图数据聚类、多视图聚类、小样本学习等多个方面取得系列成果。主要创新成果包括:1)基于可能世界的AdaBoost不确定数据分类;2)基于代表可能世界特征向量矩阵一致性学习的不确定数据聚类;3)基于代表性可能世界的不确定数据一致聚类;4)基于特征和实例迁移的加权多任务聚类;5)基于图胶囊网络的图聚类;6)自监督深度多视图谱聚类;7)端到端多模态深度聚类;8)部分实例和簇数据上的多视角聚类算法;9)基于共性和特性挖掘的深度多模态聚类;10)基于深度神经网络的图聚类。在CVPR、KDD、IJCAI、TNNLS等会议期刊上发表论文27篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

张宪超的其他基金

批准号:61272374
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:60673066
批准年份:2006
资助金额:8.00
项目类别:面上项目
批准号:60503003
批准年份:2005
资助金额:6.00
项目类别:青年科学基金项目
批准号:61070016
批准年份:2010
资助金额:11.00
项目类别:面上项目
批准号:60873180
批准年份:2008
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

抑制式可能性聚类算法研究

批准号:61671377
批准年份:2016
负责人:范九伦
学科分类:F0113
资助金额:66.00
项目类别:面上项目
2

基于约束的高维数据聚类

批准号:61272374
批准年份:2012
负责人:张宪超
学科分类:F0607
资助金额:80.00
项目类别:面上项目
3

基于众数的函数型数据聚类方法

批准号:11901522
批准年份:2019
负责人:郭佳
学科分类:A0403
资助金额:24.00
项目类别:青年科学基金项目
4

基于空间相关性和高噪音不确定多值的面向油田大数据的空间聚类研究

批准号:61772420
批准年份:2017
负责人:王欣
学科分类:F0211
资助金额:65.00
项目类别:面上项目