针对实时环境下文本聚类提出的挑战,课题组拟在已有的基于参数与非参数演化计算的基础上,运用分散统计度量法对逻辑隶属度进行适应性实数编码,从而构建模糊的逻辑决策表,为基于参数的演化计算提供更鲁棒的演化算子参数选择机制。同时,利用超椭球minimax概率决策机对非参数演化计算的演化规则进行自适应学习,通过获取概率意义上的最优鉴别信息指导演化算子概率预测器的优化,从而进一步发展更具鲁棒性的非参数演化计算方法。为了实现实时性,通过引入压缩集快速学习技术来提高所提方法的运行速度并理论分析与证明其用于模糊鲁棒聚类的实时性问题。进一步地,利用并行计算技术发展实时鲁棒文本聚类算法的并行版本。对于研究的新方法,我们拟结合已有的变形的潜在语义分析法进行实时环境下的文本聚类。本课题旨在探索与提高演化计算解决文本聚类的鲁棒性与实时性问题,其研究成果对丰富信息检索与数据挖掘的研究,极具重要的学术与应用价值。
演化计算模拟自然选择与生物进化的机理,具有高效的最优解搜索能力。它利用群体的优势为复杂的聚类问题提供更具健壮性、灵活性的解决方案。本课题运用最新的群体智能技术,发展高效的演化计算新方法。创新点主要通过以下几个方面进行说明:首先针对基于参数的演化计算进行研究。由于保持群体的收敛性和多样性有利于演化计算趋于聚类问题的全局最优解,本课题对演化计算参数逻辑隶属度进行实数编码,构建参数化逻辑决策表,发展健壮的演化算子参数选择机制,为其提供精确的解决方案。其次,课题组在参数演化计算的基础上,发展了该方法,提出了非参数演化计算模型。非参数演化计算针对演化算子与群体多样性和选择压力间的关系,适应性地控制演化行为。同时,本课题研究演化计算与环境因子的关系,通过引入环境因子提高算法的全局最优收敛效率,并最终提出复合演化计算模型,对粒子进化空间进行上界约束,研究针对文本特征的演化计算,满足文本聚类的鲁棒性要求。进一步地,本课题还利用奇异值分解技术与压缩降维技术进行冗余特征去除与高维空间降维,大大降低了文本聚类的计算量,并充分发掘文档间潜在的语义联系,有效地评价语义相关性。课题组通过本项目的研究在国内外权威期刊及会议上发表科技论文14篇,其中项目负责人以第一作者在Information Sciences (IF: 3.893), Applied Soft Computing (IF: 2.679), Neurocomputing (IF: 2.005), Expert Systems With Applications (IF: 1.965), Soft Computing(IF: 1.304)等期刊发表SCI检索论文6篇(1篇IF>3.0,2篇IF>2.0,3篇IF>1.0)。同时获得中国商业联合会科学技术奖一等奖1项,二等奖1项,申请发明专利1项,培养研究生6人。研究生通过系统地学习和实践,编程技能与科研能力都得以锻炼和提高,方便其找到专业对口工作。本课题的开展在当前热门的电商平台以及网络信息监控方面具有良好的应用价值,为实现无所不在的个性化商业推荐和新闻热点事件的跟踪与监测提供更加全面和可靠的手段,推进其产业化的发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
涡度相关技术及其在陆地生态系统通量研究中的应用
硬件木马:关键问题研究进展及新动向
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于LASSO-SVMR模型城市生活需水量的预测
基于非参数概率混合模型的方向数据聚类算法研究
基于分层贝叶斯非参数模型的聚类方法
基于文本相似性的参数推荐与错误参数检测方法研究
基于谱聚类的文本聚类集成方法研究