开放域语义关系抽取、表示和计算关键技术研究

基本信息
批准号:61572477
项目类别:面上项目
资助金额:63.00
负责人:韩先培
学科分类:
依托单位:中国科学院软件研究所
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:安波,诺明花,付成,张振中,陈波,宋希良,杨凯飞
关键词:
关系抽取开放域信息抽取语义计算表示学习语义分析
结项摘要

Relation extraction is the foundation of knowledge base construction, and the representation and the computation of semantic relation are key techniques for intelligent information service. In this project, we focus on the extraction, the representation and the computation of open domain relation, and investigate the following techniques: (1) For accurate and high-coverage relation extraction in open domain text, we will exploit knowledge constraint, syntactic constraint, statistical regularity and redundancy in big data for distantly supervised relation extraction and open relation extraction. (2) For semantic relation representation, we will investigate representation learning methods based on neural network, and will organize all relations into a taxonomy by studying taxonomy induction algorithms. (3) For semantic computation on natural language sentences, we will investigate compositional semantic models based on recursive neural network, and will study deep structural semantic kernel for sentence similarity computation. Finally, we will assess the performance of our techniques on natural language question answering task.

语义关系是人类知识的核心组成部分,其抽取、表示和计算是智能信息服务的关键支撑。本课题面向智能信息服务,以现有的大规模语义知识为驱动,针对开放领域,在语义关系的抽取、表示和计算三个层面展开研究:(1) 在抽取层面,本课题利用知识约束、语法结构约束、统计分布规律性和大数据冗余性,研究远距离监督关系抽取技术和开放式关系抽取技术,实现开放域文本的高覆盖语义关系抽取。(2)在表示层面,本课题以大规模语义知识为核心,研究语义关系的表示学习技术,挖掘语义关系所承载的信息,并将其表示为适合计算的形式;研究结构推导算法,发现语义关系之间的联系,按层次分类体系有效组织语义关系,为语义计算提供基础。(3)在计算层面,本课题面向真实自然语言理解场景,研究基于深度神经网络的组合语义算法和结构化深度语义核,实现以语义知识为核心的文本语义计算。最后,本课题以智能问答为平台进行验证。

项目摘要

语义知识是人类知识的核心组成部分,其抽取、表示和计算是智能信息服务的关键支撑。本课题面向智能信息服务,开展了四个方面的研究并取得相应成果:(1) 在开放知识获取方面,围绕实体、关系、和事件三个层次的知识获取,在模型、优化和数据三个方面开展了研究。在实体知识获取方面,构建了有监督的嵌套命名实体识别模型、字典增强的命名实体识别模型、基于Bootstrapping的实体集合扩展模型;在关系/属性知识获取方面,提出了基于全局监督和基于表示学习的远距离关系抽取模型,以及实体和属性的联合抽取模型;在事件检测方面,研究了基于区块提议网络的中文事件检测方法和基于变化量学习的事件检测方法;最后,针对分类和抽取优化目标函数不一致的问题,提出了用于信息抽取的动态缩放优化方法和代价敏感正则化方法。(2) 基于知识的语义计算方面,围绕语义计算中的表示、融合和推理三个关键技术开展了研究。在表示方面,提出了文本增强的知识表示学习方法和基于上下文感知的文本表示学习方法;在融合方面,提出了基于“序列到序列”的实体消解方法和基于端到端多视角匹配的实体消解方法;在推理方面,提出了基于图的上下文感知推理规则发现算法。(3) 在组合语义算法方面,围绕语义分析技术,提出了基于句子重写的语义分析技术,基于端到端语义图生成的语义解析方法,基于半监督的词典学习的语义解析方法,基于语义子单元匹配的神经语义解析模型。(4) 在问答及相关应用方面,在技术层面,构建了基于多源异构知识推理的常识阅读理解框架;在系统原型方面,构建了基于阅读理解和基于语义解析的问答系统,并与多家公司实现了相关合作。上述成果共发表论文26篇,课题研究成果共形成高水平学术论文21篇,其中CCF A类13篇,CCF B类7篇。申请专利6项,均已受理并进入实质审查阶段。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

韩先培的其他基金

批准号:61100152
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

面向开放域知识网络的实体语义关系抽取方法研究

批准号:61672057
批准年份:2016
负责人:冯岩松
学科分类:F0211
资助金额:62.00
项目类别:面上项目
2

句法语义分析与开放域信息抽取融合技术研究

批准号:61572245
批准年份:2015
负责人:邱立坤
学科分类:F0211
资助金额:64.00
项目类别:面上项目
3

基于语义图生成的开放域语义解析关键技术研究

批准号:61906182
批准年份:2019
负责人:陈波
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
4

面向互联网开放域的弱监督关系抽取关键问题研究

批准号:61703234
批准年份:2017
负责人:张春云
学科分类:F0607
资助金额:26.00
项目类别:青年科学基金项目