XML已成为网上信息描述和交换的事实标准,XML文本检索是当前国际上的研究热点,根据查询需求将XML文本检索结果的摘要返回给用户能有效提高信息获取效率。本项目以XML信息检索引擎返回的XML元素(以文本为中心)为对象,以生成满足用户特定查询需求的、简洁且可读性良好的摘要为目标,研究面向查询的XML文本自动文摘关键技术,包括特征选择、XML元素摘要内容抽取模型、摘要内容排序模型和话题群落结构分析方法。考虑XML元素自身的结构性和检索引擎返回结果的层次性,本项目选择支持向量回归模型集成查询、内容和结构三类特征,并采用高效且具有并行化特点的瀑布型摘要内容抽取框架。对得到的摘要内容片段,利用随机冲浪模型从全局的角度考察句子的顺序关系,改善摘要的可读性。为使用户把握XML检索引擎返回结果中各子话题之间的联系,还采用基于电路图的群落结构分析法构建各子话题之间的群落结构拓扑图。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于被动变阻尼装置高层结构风振控制效果对比分析
基于改进LinkNet的寒旱区遥感图像河流识别方法
武功山山地草甸主要群落类型高光谱特征
血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展
基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析
面向查询的多文档自动文摘技术研究
面向查询的多文档自动文摘技术研究
面向查询的社会化短文本自动摘要研究
基于统计机器翻译和自动文摘的查询扩展研究