语义角色标注(SRL)是自然语言处理的一个关键问题,也是目前的一个研究热点。研究发现,SRL严重受制于自动句法分析的性能,中文语义角色标注更是如此。因此,本课题提出中文句法分析和语义角色标注的联合学习机制研究,目的是使句法分析更加适合于语义角色标注,以缩短SRL在自动句法分析和手工句法分析上的性能差异。研究内容主要包括:一是句法分析模型和联合学习机制研究,重点探索可扩充的层次句法分析模型,在此基础上,实现句法分析和语义角色标注的联合学习,使得句法分析和语义角色标注能同时有效进行,减少自动句法分析对语义角色标注系统性能的负面影响;二是基于树核函数的语义角色标注研究,研究和改进现有的树核函数,探索新颖的树核函数,同时探索语义角色关系实例的结构化信息的最佳表达形式,以更好地体现所需的各种结构化句法信息。
本课题通过句法分析和语义角色标注的联合学习研究,解决中文语义角色标注中存在的关键问题,实现一个高性能的中文语义角色标注系统;在国内和国际同行中广泛使用的基准语料上,性能达到国际领先水平。. 三年来,课题总体按照申请书计划开展,进展顺利,完成情况及取得的成果已达到预期目标。本课题已完成的研究内容包括四个方面(其中第一和第二项为申请书计划研究内容,第三和第四项为本课扩展研究内容):. 一是句法分析和语义角色标注的联合学习研究。探索了句法分析和语义角色标注的联合学习问题,以缓解语义分析对句法分析结果的严重依赖,同时能够提高两者,特别是语义分析的性能。为此,本课题从两个层次实现了句法分析和语义角色标注的联合学习模型:第一,提出了一种联合方案,该方案能够将语义分析嵌入到句法分析过程中,实现两者的同步执行;第二,在整个分析过程中,将由语义角色标注得到的语义信息集成到句法分析模型中,以更好地指导句法分析。基于中文TreeBank、中文PropBank 和中文NomBank 的实验表明了本课提出的联合学习方法优于传统的基于1 top-best句法树的方法,同时也优于基于n top-best句法树的方法。. 二是结构化句法信息在语义角色标注中的应用。首先探索了语义角色标注所需的关键结构句法信息,提出了可区分式的树结构的抽取方案,以确保抽取的树结构既涵盖关键的结构化信息,又能减少不必要的噪音。然后探索新颖的卷积树核函数,在比较产生式时用模糊匹配代替精确匹配,即只要是产生式之间的中心成分具有相似性,那么两棵子树之间就具有一定的相似性,避免了精确匹配所带来的缺点,从而使子树之间的相似度更能准确地反映语义关系之间的相似度。. 三是深入研究了中文名词性谓词的语义角色标注,从两个方面探索了动词性谓词语义角色标注在名词性谓词语义角色标注中的应用,实现了动词性谓词和词名词谓词语义角色标注的联合学习。. 四是研究了语义角色标注框架在其他自然语言处理任务中的应用:覆盖域界定和篇章分析中的论元识别。. 研究成果方面,本课题发表SCI索引源期刊论文2篇、EI索引源期刊论文8篇、国际顶级会议CIKM/SIGIR/IJCNLP/COLING论文7篇;获得软件著作权6项、专利1件。全部超过了项目预定的指标。
{{i.achievement_title}}
数据更新时间:2023-05-31
农超对接模式中利益分配问题研究
粗颗粒土的静止土压力系数非线性分析与计算方法
拥堵路网交通流均衡分配模型
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
基于最大熵原则的汉语句法分析和语义角色标注研究
基于整句层面的中文语义角色标注关键技术研究
基于结构化学习的语义角色标注方法研究
基于依存句法分析的蒙古语语义角色标注及关键技术研究