面向互联网开放域的弱监督关系抽取关键问题研究

基本信息
批准号:61703234
项目类别:青年科学基金项目
资助金额:26.00
负责人:张春云
学科分类:
依托单位:山东财经大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:徐蔚然,袭肖明,杨璐,秦鹏达,杜亨方,柴彦娥
关键词:
关系抽取模板抽取信息抽取弱监督
结项摘要

To extract relations among entities from open web is important for semantic search, question answer system, construction of knowledge graph and other applications in intelligent search era. Hence, open relation extraction has become a hot research issue in information extraction domain recently. One of the mostly used methods for open relation extraction is weak-supervised method. However, because existing weak-supervised methods are mostly lack of semantic constraints, they are still difficult to satisfy practical criteria. To address the problem mentioned above, this proposal plans to incorporate some related tools such as deep learning, optimization method and statistical theory to handle the three key problems from the perspective of semantic constraint: (1) How to form a multi-level feature based structured fusion scheme to represent relation, and thus based on the structured pattern representation, we can improve the accuracy of weak-supervised methods. (2) How to build a robust pattern similarity determination mechanism to enhance the recall of weak-supervised methods. (3) How to construct trigger words constrained bootstrapping framework. With this model, we can constrain the relational semantics and suppress semantic drift problem to further improve the accuracy of weak-supervised method. The three key problems to be investigated are basically general problems in information extraction domain, thus, if they are properly solved, corresponding ideas are expected to be applied to other information extraction techniques to improve their performances.

从海量互联网数据中抽取实体间语义关系对语义搜索、问答系统、知识图谱的构建等应用具有重要意义,因此,开放式关系抽取成为近年来信息抽取领域的研究热点。目前被广泛认可的开放式关系抽取方法为弱监督方法,但是,由于现有弱监督方法大都缺乏语义约束,仍不能满足开放式关系抽取的要求。针对上述问题,本项目以语义约束为切入点,利用深度学习、优化方法和统计理论等工具,探索提升弱监督关系抽取性能的三个关键问题:(1)如何融合多层次关系特征、形成关系模式的结构化表示方案,从而提高弱监督方法的抽取精度。(2)如何建立鲁棒的关系模式相似性判定机制,实现对新关系模式的相似性衡量,进而提高关系抽取方法的召回率。(3)如何构建关系触发词约束的bootstrapping关系抽取模型,从而抑制语义漂移、提升系统抽取性能。本项目所研究的关键问题,在信息抽取领域具有一定共性。本项目的研究可望为其它开放式信息抽取提供一个新思路。

项目摘要

关系抽取是信息抽取技术的重要环节,是指从自然语言文本中寻找并判定实体之间存在的关系。从海量互联网开放式数据中进行关系抽取对语义搜索、问答系统、知识图谱的构建等应用具有重要意义。围绕开放式关系抽取这一课题,本项目开展以下四个方面的研究:(1)提出了一种基于多元卷积神经网络注意力机制的关系分类方法,通过多元神经网络注意力机制挖掘目标关系的触发特征,从而提升关系抽取的性能;(2)提出一种基于对抗式零样本的关系学习方法,采用条件对抗式生成网络通过对关系实例和关系描述文本的对抗式学习,学习关系描述文本到关系语义的映射,实现对未知关系的预测;(3)提出一种基于对抗训练的鲁棒远程监督关系抽取方法,采用远程监督方法自动的从距离监督训练集中发现噪声数据,并通过对抗式生成网络转移这些噪声数据到负样本集合中,实现对远程监督方法的去噪,进而提高关系抽取性能;(4)提出一种基于深度强化学习的关系抽取方法,采用深度强化学习方法学习独立于关系抽取模型的噪声过滤器,从而过滤训练样本噪声、提升关系抽取性能。本项目的研究从端到端的深度学习、零样本学习、弱监督学习以及强化学习等多个角度全面剖析提升关系抽取技术,思路可望为其它开放式信息抽取任务,增强计算机对自然语言文本数据的智能处理能力。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
3

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021
4

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

张春云的其他基金

相似国自然基金

1

面向开放域知识网络的实体语义关系抽取方法研究

批准号:61672057
批准年份:2016
负责人:冯岩松
学科分类:F0211
资助金额:62.00
项目类别:面上项目
2

面向大规模知识图谱的弱监督中文实体关系抽取研究

批准号:61573163
批准年份:2015
负责人:周光有
学科分类:F0607
资助金额:60.00
项目类别:面上项目
3

基于简标注和弱监督学习的开放的信息抽取研究

批准号:61103077
批准年份:2011
负责人:周德宇
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目
4

面向开放领域的自动关系抽取技术研究

批准号:60803078
批准年份:2008
负责人:陈锦秀
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目