基于参数与非参数演化计算新方法的文本聚类研究

基本信息

批准号：61103129

项目类别：青年科学基金项目

资助金额：22.00

负责人：宋威

学科分类：

依托单位：江南大学

批准年份：2011

结题年份：2014

起止时间：2012-01-01 - 2014-12-31

项目状态：已结题

项目参与者：章成志,杨开荍,钱雪忠,刘飒,白玉召,曹晓龙

关键词：

演化计算分散统计度量聚类压缩集学习技术概率预测

结项摘要

针对实时环境下文本聚类提出的挑战，课题组拟在已有的基于参数与非参数演化计算的基础上，运用分散统计度量法对逻辑隶属度进行适应性实数编码，从而构建模糊的逻辑决策表，为基于参数的演化计算提供更鲁棒的演化算子参数选择机制。同时，利用超椭球minimax概率决策机对非参数演化计算的演化规则进行自适应学习，通过获取概率意义上的最优鉴别信息指导演化算子概率预测器的优化，从而进一步发展更具鲁棒性的非参数演化计算方法。为了实现实时性，通过引入压缩集快速学习技术来提高所提方法的运行速度并理论分析与证明其用于模糊鲁棒聚类的实时性问题。进一步地，利用并行计算技术发展实时鲁棒文本聚类算法的并行版本。对于研究的新方法，我们拟结合已有的变形的潜在语义分析法进行实时环境下的文本聚类。本课题旨在探索与提高演化计算解决文本聚类的鲁棒性与实时性问题，其研究成果对丰富信息检索与数据挖掘的研究，极具重要的学术与应用价值。

项目摘要

演化计算模拟自然选择与生物进化的机理，具有高效的最优解搜索能力。它利用群体的优势为复杂的聚类问题提供更具健壮性、灵活性的解决方案。本课题运用最新的群体智能技术，发展高效的演化计算新方法。创新点主要通过以下几个方面进行说明：首先针对基于参数的演化计算进行研究。由于保持群体的收敛性和多样性有利于演化计算趋于聚类问题的全局最优解，本课题对演化计算参数逻辑隶属度进行实数编码，构建参数化逻辑决策表，发展健壮的演化算子参数选择机制，为其提供精确的解决方案。其次，课题组在参数演化计算的基础上，发展了该方法，提出了非参数演化计算模型。非参数演化计算针对演化算子与群体多样性和选择压力间的关系，适应性地控制演化行为。同时，本课题研究演化计算与环境因子的关系，通过引入环境因子提高算法的全局最优收敛效率，并最终提出复合演化计算模型，对粒子进化空间进行上界约束，研究针对文本特征的演化计算，满足文本聚类的鲁棒性要求。进一步地，本课题还利用奇异值分解技术与压缩降维技术进行冗余特征去除与高维空间降维，大大降低了文本聚类的计算量，并充分发掘文档间潜在的语义联系，有效地评价语义相关性。课题组通过本项目的研究在国内外权威期刊及会议上发表科技论文14篇，其中项目负责人以第一作者在Information Sciences (IF: 3.893), Applied Soft Computing (IF: 2.679), Neurocomputing (IF: 2.005), Expert Systems With Applications (IF: 1.965), Soft Computing(IF: 1.304)等期刊发表SCI检索论文6篇（1篇IF＞3.0，2篇IF＞2.0，3篇IF＞1.0)。同时获得中国商业联合会科学技术奖一等奖1项，二等奖1项，申请发明专利1项，培养研究生6人。研究生通过系统地学习和实践，编程技能与科研能力都得以锻炼和提高，方便其找到专业对口工作。本课题的开展在当前热门的电商平台以及网络信息监控方面具有良好的应用价值，为实现无所不在的个性化商业推荐和新闻热点事件的跟踪与监测提供更加全面和可靠的手段，推进其产业化的发展。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：

发表时间：

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

宋威的其他基金

批准号：61802402

批准年份：2018

资助金额：24.00

项目类别：青年科学基金项目

批准号：11101105

批准年份：2011

资助金额：16.00

项目类别：青年科学基金项目

批准号：61673193

批准年份：2016

资助金额：59.00

项目类别：面上项目

批准号：31800999

批准年份：2018

资助金额：27.00

项目类别：青年科学基金项目

批准号：91957118

批准年份：2019

资助金额：91.00

项目类别：重大研究计划

批准号：61105045

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：11702286

批准年份：2017

资助金额：30.00

项目类别：青年科学基金项目

相似国自然基金

基于非参数概率混合模型的方向数据聚类算法研究

批准号：61876068

批准年份：2018

负责人：范文涛

学科分类：F0605

资助金额：62.00

项目类别：面上项目

基于分层贝叶斯非参数模型的聚类方法

批准号：61502183

批准年份：2015

负责人：范文涛

学科分类：F0605

资助金额：19.00

项目类别：青年科学基金项目

基于文本相似性的参数推荐与错误参数检测方法研究

批准号：61772071

批准年份：2017

负责人：刘辉

学科分类：F0203

资助金额：60.00

项目类别：面上项目

基于谱聚类的文本聚类集成方法研究

批准号：60975042

批准年份：2009

负责人：卢志茂

学科分类：F0603

资助金额：32.00

项目类别：面上项目

基于参数与非参数演化计算新方法的文本聚类研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

基于铁路客流分配的旅客列车开行方案调整方法

针对弱边缘信息的左心室图像分割算法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

智能煤矿建设路线与工程实践

宋威的其他基金

基于片上标签内存的控制流劫持硬件防御机制关键技术研究

迭代函数方程的若干论题

基于多群体融合与数据驱动的群体智能算法研究

ERK的亚细胞定位对果蝇Akh代谢功能的调节作用

肿瘤分泌蛋白差异化调节机体糖和脂代谢的机制研究

基于多关系数据挖掘的跨媒体推荐关键技术研究

高超声速边界层转捩对旋转飞行器自由飞运动的影响研究

相似国自然基金