本课题在总结和吸纳国内外篇章语义分析方面现有成果的基础上,面向开放域新闻语料,提出一套篇章语义表示形式"篇章场景透视图",篇章场景透视图以层次结构图的形式充分地刻画篇章中实体与实体之间,事件与实体之间,事件与事件之间复杂的语义关系,以场景和核心事件链作为篇章语义的宏观线索。为了自动地构建篇章场景透视图,需要深入研究面向篇章的词汇和句子级的语义处理,实体、关系和事件的挖掘与融合,场景划分及核心事件链识别,并建设相应的语言知识资源,研制中文篇章语义分析实验系统平台,同时以阅读理解和多文档自动文摘这两项应用作为对篇章语义分析效果的验证。句子级中文语义依存分析是篇章级语义分析的重要基础,开放类实体关系的抽取与共指识别,事件挖掘、场景划分及核心事件链的构造是本课题的研究重点。既能刻画篇章宏观结构,又能描写微观内容,既有篇章理解的深度,又不过分依赖于人工构建的知识资源,是本课题的显著特点。
本课题在总结篇章语义研究国内外经典和前沿的研究成果的基础上,提出并实现了一套完整的篇章语义表示体系,该体系包括:1)篇章表示方法,从大规模文本数据中将词汇、短语乃至句子映射到同一语义空间中,为篇章级的语义计算奠定基础;2)篇章关系分析方法,以语义表示为基础,获取同一文档内两个文本块之间的语义关系,为篇章的结构化表示奠定基础;3)篇章结构建模,在篇章关系的基础上,构建篇章结构拓扑图,清晰的揭示出段落之间的语义联系;4)事件链,本课题在篇章结构建模的基础上还对篇章的主题结构进行分析,以词汇链的形式将作为篇章主题代表的事件呈现出来,并对事件赋予权重用于区分事件的重要性;5)篇章联想,原文内容并不能脱离外部背景知识而存在,本课题为上述的分析结果补充外部背景知识,通过联想三元组背景知识进一步提升篇章语义表示的性能。为了证明本课题实现的篇章语义表示体系的有效性,本课题将其应用于阅读理解和作文评阅两项典型的需借助篇章分析的应用中,实验结果证明了本课题提出的篇章语义表示体系能够在对篇章建模的基础上充分量化篇章之间的语义关系,进而提升两项应用的性能。当然,除去以上两项典型应用,篇章语义表示体系还可以应用于事件抽取、自动文摘、依存分析等典型的自然语言处理任务中。在课题实现的基础上,本课题共形成论文110篇,已授权专利2项,部分成果达到国际领先水平。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
面向多层次篇章语义的机器翻译理论、方法与实现
社交媒体中文本情感语义计算理论和方法
基于词汇语义网络的中文深层语义分析
基于语义分析的中文微博信息挖掘方法研究