面向问题的自动文摘任务主要采用基于简单特征的句子抽取方法,存在摘要句信息冗余大、主题不连贯、不能很好地回答问题等缺陷。为了改善摘要性能,本申请提出引入篇章分析的理论和技术,从三个方面展开研究:第一,从语言学角度出发,并综合考虑篇章分析的可计算性,融合了修辞结构理论(RST)和语篇向心理论(CT),综合语句的修辞关系和话题转移关系定义了篇章标注体系,并提出了基于条件随机场的自动篇章标注方法;第二,为了使主题连贯均衡地分布在摘要中,提出了利用篇章关系构建主题模型,在语句层和词汇层建立了双层主题结构,在词汇层为主题构造层级概率生成模型,并通过语句的篇章关系调整主题的划分;第三,由于问题回答(QA)融入了自动文摘任务中,课题针对复杂观点型问题提出了判别和分析方法,以及文本语句观点倾向性分析的方法。本申请的研究成果,不仅为改进自动文摘系统提供了一种新的思路,而且为篇章分析等工作提供了基础资源和技术。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
混凝土SHPB试验技术研究进展
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
面向查询的多文档自动文摘技术研究
面向查询的多文档自动文摘技术研究
面向查询的XML文本自动文摘研究
面向篇章翻译的关键技术研究与实现