With the development of information technology, many data can be produced by all walks of life every day. People often apply clustering algorithms to mining some useful information from a large scale of data. Semi-supervised clustering, one of clustering algorithms, can use a small amount of labeled data to aid the clustering process. So many researchers had recently thought that semi-supervised clustering is popular. However, on the one hand a lot of semi- supervised clustering algorithms cannot show good advantage over other clustering approaches, on the other hand some classification and clustering technology based the geometric covering methods had been demonstrated their superiority. So this project will apply the geometric covering to the semi-supervised clustering algorithms and have an important effect on the theory of value and the application prospect. This project will research not only three geometric covering methods, such as, the methods related to the hypersphere and hyperellipsoid, the core-sets and the level sets, but also the way of selecting and using a small amount of labeled data. At last, if this project can be finished, its research achievements will be many semi-supervised clustering algorithms competent for the practical application.
随着信息技术的迅速发展,各行各业每天都将产生各种各样的数据,人们要从这些数据中获取有用的信息,往往会求助于聚类技术。半监督聚类属于聚类技术的一种,它可以使用少量的监督信息来辅助大量无标记数据的聚类,近年来受到许多学者的关注。然而,一方面,当前的许多半监督聚类算法表现出来的性能常常并不能令人满意,另一方面,一些基于几何覆盖方法的监督学习和无监督学习算法在实际应用中已经证明了它们的优异性能,因此课题将几何覆盖方法引入半监督聚类,研究基于几何覆盖方法的半监督聚类算法,其研究不仅具有重要的理论意义,而且还具有广泛的应用前景。研究内容上,课题主要根据基于超球和超椭球的、基于Core-sets的以及基于水平集的三种几何覆盖方法来展开研究,除此之外,课题还将研究如何选择与利用少量的监督信息。通过课题的研究,以期丰富半监督聚类算法,为半监督聚类算法走向实用打下坚实基础。
随着互联网和计算机技术的迅速发展,人们常利用聚类技术来处理大量数据,因此聚类技术成为近年来国内外研究的热点。无监督和半监督聚类都属于聚类技术,不过当前许多无监督和半监督聚类方法在处理数据时其聚类效果并不好,而另一方面,一些基于超球支持向量机、基于Core sets思想以及基于水平集的几何覆盖方法在监督式机器学习中已经证明了它们的优异性能,因此课题将基于几何覆盖方法的半监督聚类算法的研究作为重要的研究内容。课题在研究期间,不仅引入近邻规则、样本加权、遗传算法、扩散过程等到无监督聚类或半监督聚类中,并提出了相关的新方法;而且将Core-sets、超球支持向量机等概念引入聚类中,提出了新的半监督或无监督聚类方法;此外,课题还在相关领域进行了一些扩展性研究。从实验结果来看,课题研究中提出的无监督和半监督聚类新算法可以提高聚类的精度,这也使得课题的研究具有重要的科学意义和应用前景,为聚类技术进一步走向实用化打下更为坚实的基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
五轴联动机床几何误差一次装卡测量方法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
基于半监督学习的聚类集成机理及高效算法研究
半监督聚类及其应用研究
多视图半监督聚类集成方法及应用研究
半监督文本聚类算法在个性化文本分析上的研究