基于最大似然原理的分层聚类算法研究

基本信息
批准号:61103005
项目类别:青年科学基金项目
资助金额:22.00
负责人:李建伏
学科分类:
依托单位:中国民航大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:贺怀清,王静,肖春景,杨鹏,王赫,杨国鑫
关键词:
分层聚类最大似然法分治免疫粒子群
结项摘要

由于本身结构的特点导致分层聚类算法聚类质量差。鉴于最大似然法在进化树重构领域的良好表现,本项目研究一种基于最大似然原理的分层聚类算法以解决现有分层聚类算法聚类质量差的问题。基于最大似然原理的分层聚类算法的整体结构不同于现有分层聚类算法,其基本思想是首先根据属性状态转换模型计算每一个可能的聚类结果(树状图)的最大似然值,然后从中选择最大似然值最大的一个作为最终结果。本项目首先研究一种属性状态转换模型;接下来由于基于最大似然原理的分层聚类算法的时间复杂度较高,建立一种基于免疫粒子群的分层聚类方法和一种基于分治策略的最大似然分层聚类方法。本项目的研究将会对分层聚类算法的研究做出积极的贡献。

项目摘要

聚类是进行数据分析的一种重要手段和方法。根据聚类过程的不同,聚类算法主要分为划分聚类和分层聚类两大类。与划分聚类算法相比,分层聚类算法具有得到的结果包含的信息更多、无须用户指定任何参数以及聚类过程是确定的,不需要任何回溯等优点。但是恰恰由于不能回溯,分层聚类算法聚类质量差。.另一方面,现有的聚类算法(包括划分聚类和分层聚类),其基本策略都是通过距离函数将原始数据转换为表示两两距离的距离矩阵,然后再对距离矩阵做进一步处理。研究表明,采用不同的距离计算函数对聚类结果的影响很大,而且目前对于距离函数的选取也没有指导标准。尤其是对于用分类属性表示的聚类数据,很难找到合适的距离计算函数。而在实际应用中需要聚类的数据在很多情况下都是由分类属性表示的。通过本课题的研究,我们借鉴生物学中构建进化树的先进经验,利用最大似然法构建进化树的重要结论,提出了新的基于最大似然原理的分类属性数据分层聚类算法。该算法不仅能直接处理分类属性数据而不依赖于距离函数,并且克服了分层聚类不能回溯的缺点。测试结果表明新算法的聚类准确率均高于经典的ROCK算法和K-Modes算法。.为了进一步改善聚类效果,提出了两种启发式的最大似然层次聚类算法:基于免疫粒子群的分层聚类方法和基于分治策略的最大似然分层聚类方法,取得了较好的效果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

DOI:10.16606/j.cnki.issn0253-4320.2022.10.026
发表时间:2022
2

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
3

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
4

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017
5

宽弦高速跨音风扇颤振特性研究

宽弦高速跨音风扇颤振特性研究

DOI:
发表时间:2021

李建伏的其他基金

相似国自然基金

1

空间移变最大似然迭代复原算法及应用研究

批准号:10905051
批准年份:2009
负责人:赵宗清
学科分类:A2905
资助金额:24.00
项目类别:青年科学基金项目
2

高速相干光OFDM通信系统基于Viterbi算法最大似然序列检测的噪声补偿算法研究

批准号:61501313
批准年份:2015
负责人:徐卓然
学科分类:F0109
资助金额:22.00
项目类别:青年科学基金项目
3

基于最大似然直线匹配的遥感影像配准方法研究

批准号:41801274
批准年份:2018
负责人:张谦
学科分类:D0113
资助金额:25.00
项目类别:青年科学基金项目
4

最大似然框架下多物种隔离-移民模型的研究

批准号:31301093
批准年份:2013
负责人:朱天琪
学科分类:C0608
资助金额:20.00
项目类别:青年科学基金项目