面向查询的多文档自动文摘将查询结果文档集合的内容提炼为包含与查询相关的主题、满足个性化需求的摘要,它能够显著提高信息获取和利用的效率。本项目的研究策略有以下特色:提出了文本、段落两阶段聚类发现潜在子主题的策略;设计了五种文摘模式,满足个性化的信息需求;以主题为单位构造文本集合的网络拓扑图,支持按照逻辑顺序浏览信息。在具体的技术和算法研究上,有以下创新:把复杂网络的理论与方法应用于面向查询的多文档自动文摘,它在文摘主题发现、拓扑结构显示等方面有鲜明特色;提出了利用聚类差异度-不纯度优化法自动确定聚类个数的方法;提出了利用用户自反馈信息与弱指导的机器学习策略自动判定相关与不相关文档的方法,能避免靠经验确定相关文档数的主观性;提出了基于主题词对分布的文档排序策略。同时,还将建设为多文档自动文摘服务的中文语料库,这是相关研究急需的语言资源。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于多模态信息特征融合的犯罪预测算法研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
多空间交互协同过滤推荐
多源数据驱动CNN-GRU模型的公交客流量分类预测
三级硅基填料的构筑及其对牙科复合树脂性能的影响
面向查询的多文档自动文摘技术研究
面向查询的XML文本自动文摘研究
基于信息重组的多文档自动文摘技术
基于逻辑框架的多文档自动文摘技术