面向开放域数据的情报知识图谱构建技术研究

基本信息
批准号:U1836108
项目类别:联合基金项目
资助金额:66.00
负责人:刘建毅
学科分类:
依托单位:北京邮电大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李娟,施蕾,董士琪,钟瑶,李可一,卢春景,陈元昆,陆晨,赵凯峰
关键词:
关系抽取知识图谱实体链接信息抽取实体抽取
结项摘要

According to the characteristics of heterogeneous types, multi-sources information and different quality of the intelligence data in the open domain of Internet, the theory and techniques of intelligence knowledge graph construction are set as the scientific goals. The project is focused on four basic science issues. The self-adaptive knowledge extraction technology based on the semi-supervised and syntax Semantic analysis is proposed to extract entities, relationships and attributes of important entities and special organizations. The knowledge fusion technology based on semi-supervised and semantic subgraph matching is proposed to realize the alignment association and fusion extension of multi-source knowledge as well as to support the construction of intelligent knowledge graph with high availability. The knowledge credibility evaluation method based on evidence theory and knowledge error detection method based on pattern induction and classification, are put forwad to realize the reliability detection and error detection of debris knowledge. The large-scale intelligence knowledge graph construction tools will be developed to provide knowledge support for intelligence analysis. The research results can provide the necessary theoretical basis and technical reference for the construction of knowledge graph.

针对互联网开放域数据“类型多样异构,信息多源离散,质量良莠不齐”的特点,以建立情报知识图谱构建的理论与方法为科学目标,深入、系统地研究基于弱监督与句法语义分析结合的情报自适应知识抽取技术,实现围绕关键人物、特殊组织的实体、关系与属性的精准抽取,解决目前知识抽取方法通用性差、多类型数据抽取召回率低的问题;研究基于弱监督和语义子图匹配的知识融合技术,实现多源知识的对齐关联和融合扩充,支持具有高可用性的情报知识图谱构建,解决现有的知识融合方法人工参与度高、无法有效处理训练数据缺乏的问题;研究基于证据理论的知识可信性评估、基于模式归纳和分类预测的知识错误检测方法,实现碎片知识的可靠性检测和错误发现;研发大规模情报知识图谱的自动构建工具,为情报分析提供知识支撑;形成一批具有自主知识产权的成果,为知识图谱的建设和应用提供必要的理论基础和技术参考。

项目摘要

本项目针对互联网开放域数据“类型多样异构,信息多源离散,质量良莠不齐“的特点,以建立情报知识图谱构建的理论与方法为科学目标,深入、系统地研究情报自适应知识抽取技术,提出了基于义原表示学习的词向量表示算法、基于迁移学习的实体抽取算法、基于分段卷积池化和焦点函数的Bert增强语义关系抽取算法、基于层次注意力机制的远程监督属性抽取算法,实现了实体、关系与属性的精准抽取,解决目前知识抽取方法通用性差、多类型数据抽取召回率低的问题;研究知识融合技术,提出了基于神经张量网络的跨知识图谱实体对齐算法、基于度量学习的零样本实体链接算法,实现多源知识的对齐关联和融合扩充,支持具有高可用性的情报知识图谱构建,解决现有的知识融合方法人工参与度高、无法有效处理训练数据缺乏的问题;研究知识可信性评估和知识错误检测方法,提出了基于证据理论的情报可信度评估算法、基于多模态知识表示推理的三元组分类算法,实现碎片情报的可靠性检测和错误发现。研发大规模情报知识图谱的自动构建工具,面向网络威胁情报设计了本体知识库,实体层包含12个一级本体类型;关系层定义了14种实体间关系类型;属性层定义了6个共有属性和185个特有属性,搭建了面向网络威胁的知识图谱系统,有助于提升国家及企业对网络威胁的检测和追溯能力。项目执行期间共发表论文15篇,其中SCI检索11篇,EI检索4篇,授权2项专利,申请11项专利,获得中国人工智能学会技术发明奖1项、电力科技创新奖1项,参加13次国际和全国学术会议,培养研究生13名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
4

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020
5

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017

刘建毅的其他基金

相似国自然基金

1

面向商务大数据的知识图谱引擎构建方法与关键技术研究

批准号:91846204
批准年份:2018
负责人:陈华钧
学科分类:F0607
资助金额:240.00
项目类别:重大研究计划
2

面向特定领域的知识图谱构建与应用关键技术研究

批准号:U1836118
批准年份:2018
负责人:程军军
学科分类:F0606
资助金额:65.00
项目类别:联合基金项目
3

面向开放域知识网络的实体语义关系抽取方法研究

批准号:61672057
批准年份:2016
负责人:冯岩松
学科分类:F0211
资助金额:62.00
项目类别:面上项目
4

面向监控视频大数据的视频图谱构建关键技术研究

批准号:61672254
批准年份:2016
负责人:邹复好
学科分类:F06
资助金额:63.00
项目类别:面上项目