Ensemble (or, fusion, aggregation) based decision is an important research topic in pattern recognition and machine learning. A wide range of applications of classification ensemble has validated the effectiveness of information ensemble. Data clustering is also one of the baisc pattern analysis tasks. Although clustering ensemble has been used in improving clustering results as well as many other unsupervised data processing problems, there is still much space for the investigation of more effecitve clustering ensemble algorithms. Based on the reviewing of previous literature on clustering ensemble, we found that the following problems are still not well studied: (1) the theoretical basis of clustering ensemble and the basic properties of the criterion function used in ensemble, (2) efficient clustering ensemble algorithms are used on large scale dataset, and (3) the applications in low-dimensinal data segmentation. To this end, this project plans to introduce the recent development in classification ensemble, rank aggregation, and social choice theory to explore the theoretical basis of clustering ensemble. Then efficient ensemble algorithms are investigated and proposed. Finally, this project will intergrate the domain knowledge and appriproate optimization methods to solve the low-dimensional data segmentation problems such as image segmentation and video scene segementaion. To sum up, this project aims to solid the theoretical basis of clustering ensemble, proposeds efficient and effecitve ensemble agorithms, and applies them into real application.
集成(融合)决策是模式识别机器学习的一个重要研究手段,分类集成的广泛应用已经验证了通过融合可以提高识别结果的有效性。聚类也是基本的模式分析任务之一,聚类集成可以用于增强聚类结果的有效性,还可以用于很多非一般性的聚类问题。由于其研究历史比较短,许多问题尚需进一步研究。本课题对聚类集成的基本理论及其应用进行了分析,发现以下问题亟待解决:(1)聚类集成的理论基础与准则函数的基本性质,(2)适用于大规模数据集的高效集成算法,(3)面向低维特定领域的聚类集成应用。课题将借鉴相关集成决策(即:分类集成、排序集成以及社会选择理论)的思路与方法来研究探索聚类集成的基本理论,以此为基础设计高效的聚类集成算法,并结合领域知识、适宜的优化方法来解决视频(场景、镜头)分割、图像分割中的多方法集成。通过此课题的研究,要进一步完善聚类集成的理论基础,提高聚类集成的有效性与实用性,拓宽其在具体任务上的应用。
针对项目主要研究内容,我们开展了一系列的研究工作,取得的主要研究成果为:(1)进一步研究聚类集成理论方法,我们提出了“数据碎片”概念,存在的聚类集成算法主要是面对数据点的,而我们提出了有效的基于“数据碎片”的集成方法,该碎片是积累中最小的不可划分的子集,为了建立这个理论,我们证明了聚类集成可以直接通过“数据碎片”的操作,并通过适当的评价方式实现;(2)在“数据碎片”概念的基础上,我们提出了三个新的聚类集成算法,通过修改现有的三个基于点的聚类集成算法,即分别为,Agglomerative,Furthest和LocalSearch。为了与原始基于点的算法进行区别,这三个新的算法分别被称为F-Agglomerative,F-Furthest和F-LocalSearch;(3)以上面设计的聚类集成算法,结合领域知识、适宜的优化方法来解决图像分割中的多方法集成问题。通过此课题的研究,要进一步完善聚类集成的理论基础,提高聚类集成的有效性与实用性,拓宽其在具体任务上的应用;以上述成果为核心,项目在一流国际会议上发表了6篇论文,期刊上发表1篇论文,同时申请发明专利6项,项目执行期间获授权4项。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
基于铁路客流分配的旅客列车开行方案调整方法
针对弱边缘信息的左心室图像分割算法
基于改进LinkNet的寒旱区遥感图像河流识别方法
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
流形上的低秩表示及其在图像视频聚类中的应用
用于SAR图像自动分割的免疫多目标集成聚类方法研究
基于量子鱼群优化策略的聚类算法及其在图像分割中的应用研究
基于模糊与核聚类算法的脑磁共振图像分割方法研究