Understanding natural language for the human is complex thought reasoning process, it depends on the knowledge of linguistics, common sense knowledge as well as thinking law and so on. However, discourse semantic analysis is most significant and most difficult problem in natural language processing. Chinese discourse frame semantic network represents to Chinese discourse semantic structure based on Chinese FrameNet and extracts a discourse frame semantic relationships that means to extract the semantic skeleton of discourse. The establishment of the frame semantic reasoning mechanism means that it can realize the deep discourse semantic analysis. Based on Chinese FrameNet of Shanxi University, the project is oriented to deep discourse semantic analysis with the technology research on automatic extraction and semantic reasoning of Chinese discourse frame semantic relations network, the research including: (1)Constructing the support resources which is required by Chinese discourse frame semantic relations network with the technology research of automatic extraction. (2)Studying discourse context semantic relations automatic tagging technology. (3)Researching on the technology of automatic identification and filling null instantiation frame elements in the discourse. (4)Establishing a discourse semantic reasoning mechanism based on frame relations and developing the tool software with the function of automatic extraction and semantic reasoning of Chinese discourse frame semantic relations network. The research results of the project will provide a novel way to achieve deep discourse semantic analysis, form discourse semantic analysis theory system based on Chinese FrameNet and innovate discourse semantic analysis theory and application.
人类对自然语言的理解是复杂的思维过程,它依赖语言学、常识性知识以及思维规律等,篇章语义分析是自然语言处理中最重要也是最困难的问题。汉语篇章框架语义关系网是篇章的语义结构形式化描述,抽取篇章的框架语义关系网意味着抽取了这个篇章的语义骨架,建立框架语义推理机制意味着能够实现篇章语义的深层次挖掘。本项目基于汉语框架网语义资源,研究面向篇章深层语义分析的篇章框架语义关系网自动抽取及其语义推理技术,研究内容包括:(1)针对篇章汉语框架语义关系网自动抽取技术,建立所需的支撑资源;(2)研究篇章上下文语义关系自动标注技术;(3)研究篇章零形式框架元素自动识别与填充技术;(4)建立基于框架关系的篇章语义推理机制,研发汉语篇章框架语义关系网自动抽取及语义推理工具软件。项目的研究成果将为汉语篇章深层次语义分析方法提供新的思路,形成基于框架语义知识库的篇章语义分析理论体系,创新篇章语义分析的理论与方法。
本项目针对汉语篇章的语义结构表示问题,以框架语义学为理论基础,利用框架语义描述体系来刻化汉语篇章语义,系统地研究了汉语篇章框架语义关系网自动抽取与语义推理关键技术。项目的主要研究内容及重要结果包括:(1)建立了汉语篇章上下文语义关系标注集;制定了汉语篇章语义关系网表示规范,构建了篇章标注资源311篇、框架1320个、词元11114个、标注例句约8万条。(2)研究了篇章上下文语义关系自动标注技术,包括篇章上下文语义相关性自动判别和篇章上下文语义关系类型自动识别两个子任务。针对第一个任务,提出基于最大熵模型的篇章关系分类器和基于贪婪策略的篇章结构树生成方法,分别获得获得57.48%的准确率和64.55%的F值。针对第二个任务,提出基于框架特征的机器学习方法,获得40.69%的准确率。(3)研究了篇章零形式框架元素自动识别与填充技术,提出基于规则和过滤的零形式识别方法、基于最大熵的零形式分类方法、基于最大熵和框架关系相结合的有定零形式填充方法,分别获得了78.84%的F值、68.88%的F值和40.19%的F值。(4)建立了基于框架关系的篇章上下文的语义关系推理机制和基于框架关系的篇章框架元素语义关系推理机制,并将汉语篇章框架语义分析及推理技术应用于阅读理解、自动问答任务,验证本项目提出方法的有效性。(5)研发了汉语篇章框架语义标注及篇章语义关系网自动抽取软件、汉语框架网资源共享平台、汉语框架网人机协同辅助标注系统、汉语框架网门户网站。项目开展以来,课题组按照项目年度研究计划执行,在国内外重要学术期刊及国际学术会议上发表论文20篇;申请发明专利4项,授权发明专利1项,获得软件著作权7项,培养博士、硕士研究生25名,超额完成了项目计划书任务。.项目的研究成果为汉语篇章语义理解提供了一种新思路,为自然语言理解相关应用领域篇章级语义分析提供了一种有效途径。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
面向汉语篇章语义分析的框架推理技术研究
汉语框架语义依存图自动抽取关键技术研究
汉语框架语义角色自动标注技术研究
面向文本推理的汉语语义计算模型研究