汉语句法结构和事件结构的联合分析研究

基本信息
批准号:61772378
项目类别:面上项目
资助金额:60.00
负责人:姬东鸿
学科分类:
依托单位:武汉大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:钱涛,吕晨,黄江平,李霏,周启楫,费豪,柳宜江
关键词:
联合模型事件结构事件抽取句法分析
结项摘要

Chinese syntactic analysis aims to make computers understand syntactic structures of sentences, and it is significant to a number of natural language processing tasks, such as event analysis. Event analysis aims to extract events in sentences, and it plays crucial roles in public opinion analysis. Syntactic structure, especially dependency structure, reflects the correlations between words in a sentence, while event structure shows the relations between event triggers and arguments. Therefore, they are somewhat different but share more correlations. Prior work performed syntactic or event analysis separately, and did not utilize the correlations between them. Therefore, we plan to design a joint model for syntactic and event analysis to solve this problem. It employs neural networks to automatically extract features, and on the other hand, it uses structured perceptrons to enhance the joint prediction of syntax and events. In addition, in previous work, the triggers of events were defined as be comprised of single word, but such definition neglects certain special phenomena in Chinese. We will construct a set of event trigger patterns based on linguistic knowledge of Chinese, and adjust syntactic structures slightly in order to make syntactic and event structures more similar, which may boost the performance of our joint model. This research is helpful for both syntactic analysis and event analysis.

汉语句法分析旨在让计算机理解句子的句法结构,它对于许多自然语言处理任务十分重要。事件分析旨在自动抽取句子中的事件,它在舆情分析等应用系统中起到了很大的作用。句法结构,特别是依存结构,体现了句子中词与词之间的相互关系,而事件结构体现了谓词和论元之间的关系,所以他们之间有区别但更有联系。以往工作都是单独地对句法和事件进行分析,没有充分利用两种结构的联系。因此本项目提出句法结构和事件结构的联合分析模型。该模型一方面利用神经网络来自动抽取特征,另一方面利用结构感知机来加强句法和事件的联合结构预测。另外,由于句法结构和事件结构常常存在不一致现象,因为本项目拟根据汉语事件触发词模板来微调句法结构,使其微观上保持句法结构的依存信息,在宏观上使句法结构和事件结构更趋一致,进而帮助联合模型提升效果。

项目摘要

依存句法分析旨在让计算机理解句子的句法结构,它对于许多自然语言处理任务十分重要。事件分析旨在自动抽取句子中的事件,它在舆情分析等应用系统中起到了很大的作用。依存结构体现了句子中词与词之间的依赖关系,而事件结构则体现了事件触发词和论元之间的关系,所以他们之间有区别但更有联系。本项目一方面以句法分析或者事件分析为研究任务,另一方面研究他们之间的联系,具体的研究内容包括:(1)基于语言学现有的关于汉语特殊语言现象的研究成果,如离合词、轻动词等,结合我们近几年来在事件链标注过程中遇到的大量实例,总结事件触发词模板。(2)基于已有的依存句法标注数据集,我们提出了一种基于事件触发词模板集的句法结构调整方法。根据事件触发词模板,将触发词结构构成超节点,超结点的内部句法结构保留,外部则继承子节点的原有边。(3)针对事件分析任务,我们提出了一种基于转移的事件触发词和论元联合抽取模型,该模型可以有效减少事件触发词和论元抽取的错误传播,在公开的基准数据集ACE2005上,取得了当时最优的结果。(4)在依存句法和事件分析联合处理方面,我们提出了一种基于依存树的事件触发词识别模型,该模型可以利用树神经网络学习句法特征,帮助事件触发词的识别,该模型在两个公开数据集上取得了不错的效果。(5)本项目还将依存句法用在了其它一些自然语言处理任务上,并取得了一定研究进展。比如,课题组提出了一种双Transformer网络来同时学习句子序列特征和句法依存特征,该模型被应用于方面级情感分析任务并取得了不错的效果。在语义角色标注任务上,课题组使用图神经网络将句法信息嵌入到序列到序列模型中,生成谓词和论元结果。综上所述,本项目不仅研究了事件结构和句法结构的理论基础,构建了相关标注资源,而且还针对相关任务提出相应的解决方案并取得了良好的结果,对自然语言处理和计算语言学的研究具有积极的推动作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

姬东鸿的其他基金

批准号:90820005
批准年份:2008
资助金额:50.00
项目类别:重大研究计划
批准号:60773011
批准年份:2007
资助金额:29.00
项目类别:面上项目
批准号:61373108
批准年份:2013
资助金额:78.00
项目类别:面上项目
批准号:61173062
批准年份:2011
资助金额:58.00
项目类别:面上项目

相似国自然基金

1

基于配价结构和话题结构的汉语句法分析和语义计算模型研究

批准号:90920004
批准年份:2009
负责人:周国栋
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划
2

基于深层学习的汉语句法语义分析研究

批准号:61273318
批准年份:2012
负责人:常宝宝
学科分类:F03
资助金额:80.00
项目类别:面上项目
3

汉语特征结构的资源建设和自动分析研究

批准号:90820005
批准年份:2008
负责人:姬东鸿
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划
4

面向篇章信息性的汉语篇章结构多层次联合分析研究

批准号:61876118
批准年份:2018
负责人:孔芳
学科分类:F0606
资助金额:62.00
项目类别:面上项目