基于参数与非参数演化计算新方法的文本聚类研究

基本信息
批准号:61103129
项目类别:青年科学基金项目
资助金额:22.00
负责人:宋威
学科分类:
依托单位:江南大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:章成志,杨开荍,钱雪忠,刘飒,白玉召,曹晓龙
关键词:
演化计算分散统计度量聚类压缩集学习技术概率预测
结项摘要

针对实时环境下文本聚类提出的挑战,课题组拟在已有的基于参数与非参数演化计算的基础上,运用分散统计度量法对逻辑隶属度进行适应性实数编码,从而构建模糊的逻辑决策表,为基于参数的演化计算提供更鲁棒的演化算子参数选择机制。同时,利用超椭球minimax概率决策机对非参数演化计算的演化规则进行自适应学习,通过获取概率意义上的最优鉴别信息指导演化算子概率预测器的优化,从而进一步发展更具鲁棒性的非参数演化计算方法。为了实现实时性,通过引入压缩集快速学习技术来提高所提方法的运行速度并理论分析与证明其用于模糊鲁棒聚类的实时性问题。进一步地,利用并行计算技术发展实时鲁棒文本聚类算法的并行版本。对于研究的新方法,我们拟结合已有的变形的潜在语义分析法进行实时环境下的文本聚类。本课题旨在探索与提高演化计算解决文本聚类的鲁棒性与实时性问题,其研究成果对丰富信息检索与数据挖掘的研究,极具重要的学术与应用价值。

项目摘要

演化计算模拟自然选择与生物进化的机理,具有高效的最优解搜索能力。它利用群体的优势为复杂的聚类问题提供更具健壮性、灵活性的解决方案。本课题运用最新的群体智能技术,发展高效的演化计算新方法。创新点主要通过以下几个方面进行说明:首先针对基于参数的演化计算进行研究。由于保持群体的收敛性和多样性有利于演化计算趋于聚类问题的全局最优解,本课题对演化计算参数逻辑隶属度进行实数编码,构建参数化逻辑决策表,发展健壮的演化算子参数选择机制,为其提供精确的解决方案。其次,课题组在参数演化计算的基础上,发展了该方法,提出了非参数演化计算模型。非参数演化计算针对演化算子与群体多样性和选择压力间的关系,适应性地控制演化行为。同时,本课题研究演化计算与环境因子的关系,通过引入环境因子提高算法的全局最优收敛效率,并最终提出复合演化计算模型,对粒子进化空间进行上界约束,研究针对文本特征的演化计算,满足文本聚类的鲁棒性要求。进一步地,本课题还利用奇异值分解技术与压缩降维技术进行冗余特征去除与高维空间降维,大大降低了文本聚类的计算量,并充分发掘文档间潜在的语义联系,有效地评价语义相关性。课题组通过本项目的研究在国内外权威期刊及会议上发表科技论文14篇,其中项目负责人以第一作者在Information Sciences (IF: 3.893), Applied Soft Computing (IF: 2.679), Neurocomputing (IF: 2.005), Expert Systems With Applications (IF: 1.965), Soft Computing(IF: 1.304)等期刊发表SCI检索论文6篇(1篇IF>3.0,2篇IF>2.0,3篇IF>1.0)。同时获得中国商业联合会科学技术奖一等奖1项,二等奖1项,申请发明专利1项,培养研究生6人。研究生通过系统地学习和实践,编程技能与科研能力都得以锻炼和提高,方便其找到专业对口工作。本课题的开展在当前热门的电商平台以及网络信息监控方面具有良好的应用价值,为实现无所不在的个性化商业推荐和新闻热点事件的跟踪与监测提供更加全面和可靠的手段,推进其产业化的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

宋威的其他基金

批准号:61802402
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:11101105
批准年份:2011
资助金额:16.00
项目类别:青年科学基金项目
批准号:61673193
批准年份:2016
资助金额:59.00
项目类别:面上项目
批准号:31800999
批准年份:2018
资助金额:27.00
项目类别:青年科学基金项目
批准号:91957118
批准年份:2019
资助金额:91.00
项目类别:重大研究计划
批准号:61105045
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:11702286
批准年份:2017
资助金额:30.00
项目类别:青年科学基金项目

相似国自然基金

1

基于非参数概率混合模型的方向数据聚类算法研究

批准号:61876068
批准年份:2018
负责人:范文涛
学科分类:F0605
资助金额:62.00
项目类别:面上项目
2

基于分层贝叶斯非参数模型的聚类方法

批准号:61502183
批准年份:2015
负责人:范文涛
学科分类:F0605
资助金额:19.00
项目类别:青年科学基金项目
3

基于文本相似性的参数推荐与错误参数检测方法研究

批准号:61772071
批准年份:2017
负责人:刘辉
学科分类:F0203
资助金额:60.00
项目类别:面上项目
4

基于谱聚类的文本聚类集成方法研究

批准号:60975042
批准年份:2009
负责人:卢志茂
学科分类:F0603
资助金额:32.00
项目类别:面上项目