Despite that Fuzzy c-means(FCM) clustering has been sucessfully applied in areas such as microarray gene expression data analysis and Magnetic Resonance Imaging(MRI) analysis, there still are some inherented disadvantages for FCM, i.e. the algorithm is sensitive to noise and only fits for data sets with spherical or hyper-spherical structures. Many modified algorithms have been put forward, i.e. robust FCM clustering with constraints and the novel fuzzy clustering combining with hyperplanes which is recently proposed by the applicant. In this project, information from constraint items are to be combined with hyperplane-based data analysis, and a group of novel robust fuzzy clustering algorithms which can handle noisy data sets with non-spherical sturcture will be studied. The aims of the project can be summarized as the follows: 1. the objective functions of the algorithms which combines constraint items with the fuzzy hyper-prototype clustering will be studied; 2. the Lagrangians of the objective functions under constraints will be formulated; 3. the novel algorithms will be derived and validated on both synthetic data sets and real world data sets and performances between existing methods will be compared; 4. the algorithms will then be applied to solve real world problems such as microarray gene expression data analysis and MR brain image analysis. By this project, novel powerful and reliable computational tools can be studied and provided for automatic data analysis across disciplines.
模糊c均值聚类(FCM)算法已经在基因数据挖掘和核磁共振图像处理等领域取得了成功的应用,然而FCM仍有些固有缺陷,如,算法对噪声敏感,且局限于球状或超球状结构的数据集等。目前已有多种改进的FCM算法被提出,如基于约束项的鲁棒FCM算法及申请者前期研究中提出的结合超平面的模糊聚类算法等。本项目拟通过结合各类约束项与超平面数据分析方法,研究出一组新型鲁棒模糊超原型聚类算法,使得数据分析能在对噪声鲁棒的同时适应非球状数据集。项目的研究内容包括:① 结合现有的鲁棒FCM算法的各种约束项与模糊超原型聚类算法写出新型算法的目标函数;②根据新型目标函数和约束条件写出对应的拉格朗日乘子式并求解;③根据所得解对算法进行实现并在合成数据集与真实世界数据集进行验证并与以往算法对比;④ 将新型算法应用于微阵列基因表达数据分析和MR脑图像数据分析。通过本项目的研究,将为各领域自动数据分析提供有力可靠的计算工具。
无监督模糊学习算法已经得到广泛关注和深入研究。本项目中,我们首先从模糊c均值聚类算法出发,结合超球形聚类原型和超平面聚类原型,提出了一种新型模糊聚类方法,也即模糊混合原型聚类算法(FMC)。FMC 算法用结合了超球形和超平面的超原型替换了原有聚类中心,其目标函数是数据样本点到聚类中心和样本点质心距离的加权和。通过采用拉格朗日乘数法,可以得到一个迭代算法,使得该目标函数在约束条件下得到极小值。我们在多个数据集上对FMC进行了验证并与现有算法进行对比,结果证实了FMC 算法的有效性,而后将FMC算法应用在了基因表达微阵列数据分析中。除此之外,通过借鉴现有的结合空域信息与模糊聚类算法的一些工作,我们另外提出一种新型算法,即结合空域约束的FMC算法(FMCS)。FMCS 的目标函数是通过结合FMC目标函数与空域约束算子得到的。 由此FMCS 可以在聚类过程中考虑到数据样本间的空域关系。同样通过拉格朗日乘数法我们可以得到一个递归算法,并得到一个在约束条件下FMCS目标函数的极小值解。通过在人工数据和真实数据集上的实验,我们验证了FMCS算法的有效性,而后我们将FMCS算法应用到了核磁共振脑图像分割问题中,结果证实了FMCS算法具有更好的效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
农超对接模式中利益分配问题研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
分布鲁棒机会约束优化及其在电力经济调度中的应用
面向多源大数据的鲁棒聚类模型与算法研究
基于鲁棒集成学习的一致性聚类方法研究
基于约束的高维数据聚类