面向问题的自动文摘任务主要采用基于简单特征的句子抽取方法,存在摘要句信息冗余大、主题不连贯、不能很好地回答问题等缺陷。为了改善摘要性能,本申请提出引入篇章分析的理论和技术,从三个方面展开研究:第一,从语言学角度出发,并综合考虑篇章分析的可计算性,融合了修辞结构理论(RST)和语篇向心理论(CT),综合语句的修辞关系和话题转移关系定义了篇章标注体系,并提出了基于条件随机场的自动篇章标注方法;第二,为了使主题连贯均衡地分布在摘要中,提出了利用篇章关系构建主题模型,在语句层和词汇层建立了双层主题结构,在词汇层为主题构造层级概率生成模型,并通过语句的篇章关系调整主题的划分;第三,由于问题回答(QA)融入了自动文摘任务中,课题针对复杂观点型问题提出了判别和分析方法,以及文本语句观点倾向性分析的方法。本申请的研究成果,不仅为改进自动文摘系统提供了一种新的思路,而且为篇章分析等工作提供了基础资源和技术。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
面向查询的多文档自动文摘技术研究
面向查询的多文档自动文摘技术研究
面向查询的XML文本自动文摘研究
面向篇章翻译的关键技术研究与实现