句子语义分析是自然语言处理的核心问题,但由于技术手段的限制,目前研究还仅限于语义角色标注等浅层分析。语义依存分析是一种深层语义分析方法,该方法为句子中每个词找到其所依存的词,并标注它们之间的语义关系,最终构成一棵语义依存树。这种语义分析方式以其形式简洁、易于标注、便于应用等优点,逐渐受到重视。对于信息抽取、问答系统等语言信息处理应用技术,仅依靠词汇、词性等文本表层的信息已经很难取得突破性的进展,必须利用更深层次的语义信息。为此,本项目针对汉语语义依存分析问题,提出了一整套研究内容,包括确定汉语语义依存关系体系、构建大规模语义依存语料库以及研制高效准确的语义依存分析模型。试图在词义消歧的基础上,利用词汇语义信息,越过词性标注和句法分析,直接进行语义依存分析,从而提升汉语语义分析的性能,为相关应用技术提供更有利的支持。
句子语义分析是自然语言处理的核心问题,它在机器翻译、信息抽取、自动问答和自动文摘等自然语言处理领域都有着广泛的应用价值。但目前研究还仅限于语义角色标注等浅层分析。语义依存分析是一种深层语义分析方法,该方法为句子中每个词找到其所依存的词,并标注它们之间的语义关系,最终构成语义依存图。本项目的目标是要构建面向汉语语义依存标注体系、语义依存分析语料库以及自动语义依存分析模型。. 经过四年的研究,本项目在以下方面取得了进展:(1)制定了一套细致、全面的汉语语义角色层级体系和语义角色标签,为后续的语义角色标注提供了理论依据;(2)对当前的语义分析方法进行了分析和总结,结合汉语属于意合型语言,不同于英语等形合型语言的语言特点,提出了语义依存图的语义依存分析方法,对依存树的理论进行了扩展;(3)运用语义依存图的语义分析方法标注了一个包含30,000个句子的语料库;(4)在该语料库的基础上,训练了一个自动语义依存分析模型,并在更广泛的数据上做实验。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
中文动态语义网构建技术研究
基于词汇语义网络的中文深层语义分析
基于语义依存图的汉语复杂名词短语资源建设与自动分析研究
篇章级中文语义分析理论与方法