大规模数据聚类的并行进化算法骨架研究

基本信息
批准号:61163006
项目类别:地区科学基金项目
资助金额:49.00
负责人:万剑怡
学科分类:
依托单位:江西师范大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:吴水秀,刘建明,王晓庆,万中英,罗文兵,陈秀平,黄奕平,余伟,陶舒怡
关键词:
算法骨架进化算法并行计算大规模数据聚类
结项摘要

现实世界不断增长的海量数据对并行计算提出了更紧迫的要求,基于骨架的并行编程模型因具有良好的可编程性而利于并行计算的普及,然而目前较有影响的MapReduce模型对复杂问题的并行求解并不能充分支持。聚类问题是一个NP难的问题,大规模数据集上的聚类是当前模式识别等应用领域的基本问题之一,只能通过并行(分布式)计算有效求解。本项目将首先研究各种聚类问题及算法,对其可并行性进行形式化分析,重点研究进化算法对聚类问题的近似求解方法,然后应用算法骨架的思想,分析进化聚类算法中可并行实现的公共模式,构造出相应的算法骨架,并在PC集群环境下实现并行进化算法骨架的框架系统。在本框架系统中,用户不需涉及底层并行编程,只需编写骨架参数所需的顺序代码,就可以得到进化聚类算法的并行程序。由于并行骨架的问题无关性,该骨架框架还可扩展应用于开发进化算法求解类似的其他最优化问题的并行程序。

项目摘要

分类与聚类是数据挖掘领域中的重要研究课题,随着数据挖掘应用的深入和数据的爆炸式增长,对高维数据和大规模数据进行分析和研究也越来越普遍和重要。数据挖掘的计算量随着数据维数的增高和数据集的增大呈指数级增长,大规模海量数据挖掘的应用程序执行效率难以令人满意。本课题从数据维数和数据量两个方面进行研究,一方面从模型角度研究对高维数据的预处理方法,另一方面从算法角度对数据挖掘算法进行并行化研究,从而提高高维大规模数据的挖掘性能。.除了对大规模数据分类与聚类相关算法及其并行化的研究之外,项目组还对大规模数据挖掘中的其他应用问题进行了研究,包括对大规模文本信息检索模型的研究、大规模图像挖掘技术的研究、群体智能优化算法及其并行化的研究等,这些研究都为本课题关键内容的研究从不同角度提供了理论、方法和技术上的支持。.围绕本项目研究内容,项目组成员发表论文25篇,包括国际会议论文和国际国内期刊论文,其中国际期刊论文6篇、国际会议论文4篇和国家A类学术期刊论文4篇,成功组织承办第八届全国信息检索学术会议(CCIR2012)和第四届自然语言处理与中文计算国际会议(NLP&CC 2015),培养统招硕士毕业生14人,完成了项目计划书中预定的各项任务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

万剑怡的其他基金

相似国自然基金

1

多粒度视角下大规模数据聚类算法研究

批准号:61603230
批准年份:2016
负责人:赵兴旺
学科分类:F0607
资助金额:20.00
项目类别:青年科学基金项目
2

大规模基因表达序列分析数据分布式并行消息传播聚类方法研究

批准号:61100118
批准年份:2011
负责人:唐东明
学科分类:F0605
资助金额:21.00
项目类别:青年科学基金项目
3

面向大规模二维数据的岭回归子空间聚类算法研究

批准号:61806106
批准年份:2018
负责人:彭冲
学科分类:F0603
资助金额:22.00
项目类别:青年科学基金项目
4

大规模低质量多视图聚类算法及其应用研究

批准号:61773392
批准年份:2017
负责人:刘新旺
学科分类:F0604
资助金额:65.00
项目类别:面上项目