篇章级中文语义分析理论与方法

基本信息
批准号:61133012
项目类别:重点项目
资助金额:270.00
负责人:刘挺
学科分类:
依托单位:哈尔滨工业大学
批准年份:2011
结题年份:2016
起止时间:2012-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:孙茂松,姬东鸿,李生,秦兵,吴泓缈,萧国政,车万翔,赵玲,陈毅恒
关键词:
事件挖掘语义依存分析实体关系挖掘篇章语义场景
结项摘要

本课题在总结和吸纳国内外篇章语义分析方面现有成果的基础上,面向开放域新闻语料,提出一套篇章语义表示形式"篇章场景透视图",篇章场景透视图以层次结构图的形式充分地刻画篇章中实体与实体之间,事件与实体之间,事件与事件之间复杂的语义关系,以场景和核心事件链作为篇章语义的宏观线索。为了自动地构建篇章场景透视图,需要深入研究面向篇章的词汇和句子级的语义处理,实体、关系和事件的挖掘与融合,场景划分及核心事件链识别,并建设相应的语言知识资源,研制中文篇章语义分析实验系统平台,同时以阅读理解和多文档自动文摘这两项应用作为对篇章语义分析效果的验证。句子级中文语义依存分析是篇章级语义分析的重要基础,开放类实体关系的抽取与共指识别,事件挖掘、场景划分及核心事件链的构造是本课题的研究重点。既能刻画篇章宏观结构,又能描写微观内容,既有篇章理解的深度,又不过分依赖于人工构建的知识资源,是本课题的显著特点。

项目摘要

本课题在总结篇章语义研究国内外经典和前沿的研究成果的基础上,提出并实现了一套完整的篇章语义表示体系,该体系包括:1)篇章表示方法,从大规模文本数据中将词汇、短语乃至句子映射到同一语义空间中,为篇章级的语义计算奠定基础;2)篇章关系分析方法,以语义表示为基础,获取同一文档内两个文本块之间的语义关系,为篇章的结构化表示奠定基础;3)篇章结构建模,在篇章关系的基础上,构建篇章结构拓扑图,清晰的揭示出段落之间的语义联系;4)事件链,本课题在篇章结构建模的基础上还对篇章的主题结构进行分析,以词汇链的形式将作为篇章主题代表的事件呈现出来,并对事件赋予权重用于区分事件的重要性;5)篇章联想,原文内容并不能脱离外部背景知识而存在,本课题为上述的分析结果补充外部背景知识,通过联想三元组背景知识进一步提升篇章语义表示的性能。为了证明本课题实现的篇章语义表示体系的有效性,本课题将其应用于阅读理解和作文评阅两项典型的需借助篇章分析的应用中,实验结果证明了本课题提出的篇章语义表示体系能够在对篇章建模的基础上充分量化篇章之间的语义关系,进而提升两项应用的性能。当然,除去以上两项典型应用,篇章语义表示体系还可以应用于事件抽取、自动文摘、依存分析等典型的自然语言处理任务中。在课题实现的基础上,本课题共形成论文110篇,已授权专利2项,部分成果达到国际领先水平。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

刘挺的其他基金

批准号:60575042
批准年份:2005
资助金额:22.00
项目类别:面上项目
批准号:61073126
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:61472107
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:60203020
批准年份:2002
资助金额:15.00
项目类别:青年科学基金项目

相似国自然基金

1

面向多层次篇章语义的机器翻译理论、方法与实现

批准号:61432013
批准年份:2014
负责人:张民
学科分类:F0211
资助金额:350.00
项目类别:重点项目
2

社交媒体中文本情感语义计算理论和方法

批准号:61632011
批准年份:2016
负责人:秦兵
学科分类:F0211
资助金额:265.00
项目类别:重点项目
3

基于词汇语义网络的中文深层语义分析

批准号:61872402
批准年份:2018
负责人:邵艳秋
学科分类:F0211
资助金额:64.00
项目类别:面上项目
4

基于语义分析的中文微博信息挖掘方法研究

批准号:61370139
批准年份:2013
负责人:张仰森
学科分类:F0211
资助金额:75.00
项目类别:面上项目