稀疏样本条件下的领域知识图谱获取与利用研究

基本信息

批准号：61872446

项目类别：面上项目

资助金额：66.00

负责人：赵翔

学科分类：

依托单位：中国人民解放军国防科技大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：王晖,蔡飞,唐国明,张啸宇,陈一帆,谭真,李瑞琪,曾维新,王炜

关键词：

数据驱动知识库领域知识图谱

结项摘要

Knowledge graph (KG) technology is an effective means of acquiring knowledge from unstructured (including semi-structured) and structured data, which is an important approach towards big data analytics and application. Research in knowledge engineering re-attained the focus due to the introduction of KG, and plays a more and more crucial role in intelligent information services, including information retrieval and automatic question answering. Domain KG differs from general-purpose KG in the scarcity of sample data, which results in that the existing learning models that requires abundant tagged samples cannot be immediately applied, or deteriorates remarkably. Through in-depth analysis of application scenarios of large-scale KG’s, this project plans to carry out research on data-driven domain KG harvest (including extraction, derivation and fusion) and utilization. It will address the problems and challenges in domain knowledge extraction under scarce sample constraints, domain knowledge derivation from general-purpose KG’s, multi-source heterogeneous domain knowledge fusion, and domain knowledge-integrated intelligent information services. It will propose a set of fundamental theories and key technologies for domain KG harvest and utilization; meanwhile, it plans to take military operation as target domain, and conduct experimental evaluation of the proposed models and methods. This research is to promote the practicality of automatic harvest and effective utilization of domain KG’s, and thus, is of great scientific significance and application value.

知识图谱技术是一种从非结构化（含半结构化）数据和结构化数据中获取知识的有效手段，是大数据分析与应用的重要途径之一。知识工程领域的研究因知识图谱的出现再度成为关注点，并在信息检索、自动问答等智能信息服务中发挥越来越重要的作用。领域知识图谱与通用知识图谱的主要区别在于样本数据的稀疏性，这导致依赖大量标注样本的学习模型无法直接适用或效能显著降低。本项目通过深入分析大规模知识图谱的运用场景，拟在数据驱动的领域知识图谱的获取（包括抽取、提取和融合）及利用上开展研究，解决稀疏样本条件下的领域知识抽取、通用知识图谱上的领域知识提取、多来源异构的领域知识图谱融合和集成领域知识的智能化信息服务方面的问题与挑战，建立一套面向领域知识图谱获取与利用的基础理论和关键技术；同时，拟选定军事作战领域作为目标领域，开展模型与方法的实验验证。研究将推动实用化的领域知识图谱自动获取与高效利用，具有重要的科学意义和应用价值。

项目摘要

知识图谱技术是一种从非结构（含半结构化）数据和结构化数据中获得知识的有效手段，是大数据分析与应用的重要途径之一。知识工程领域的研究因知识图谱的出现再度成为关注点，并在信息检索、自动问答等智能信息服务中发挥越来越重要的作用。领域知识图谱与通用知识图谱的主要区别在于样本数据的稀疏性，这导致依赖大量标注样本的学习模型无法直接适用或效能显著降低。本项目深入分析大规模知识图谱的运用场景，建立一套面向领域知识图谱获取与利用的基础理论和关键技术，研究稀疏样本约束的实体关系联合抽取问题，提出基于平移排序模型的结构化知识抽取技术和面向含噪数据的中文领域关系抽取技术；研究面向任务相关语料的领域知识表示问题，提出异构信息网络的预训练模型和基于元图的动态异构信息网络的可扩展表示学习；研究基于有限信息的异构领域知识融合问题，提出基于图分割的大规模实体对齐模型、基于度感知特征融合的实体对齐模型；研究领域知识驱动的弱监督式机器学习问题，提出基于子图推理的时序知识图谱问答方法和基于提问学习的不可回答问题归因方法。同时，选定军事作战领域作为目标领域，开展模型与方法的实验验证。研究或推动实用化的领域知识图谱自动获取与高效利用，具有重要的科学意义和应用价值。在本项目支持下，团队共发表和录用67篇论文，其中CCF A类论文19篇，CCF B类论文16篇，ACM/IEEE Transactions论文7篇，24篇被SCI或待SCI检索；获得授权国家发明专利20项，申请国家发明专利49项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.7536/pc200335

发表时间：2020

DOI：10.7507/1672-2531.202012076

发表时间：2021

DOI：10.11707/j.1001-7488.20210410

发表时间：2021

DOI：

发表时间：2017

赵翔的其他基金

批准号：21773181

批准年份：2017

资助金额：65.00

项目类别：面上项目

批准号：41401446

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：20673081

批准年份：2006

资助金额：30.00

项目类别：面上项目

批准号：31101023

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：60801035

批准年份：2008

资助金额：25.00

项目类别：青年科学基金项目

批准号：U1530143

批准年份：2015

资助金额：63.00

项目类别：联合基金项目

批准号：20073054

批准年份：2000

资助金额：15.00

项目类别：面上项目

批准号：11702230

批准年份：2017

资助金额：26.00

项目类别：青年科学基金项目

批准号：31871419

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：21171138

批准年份：2011

资助金额：55.00

项目类别：面上项目

批准号：31570294

批准年份：2015

资助金额：63.00

项目类别：面上项目

批准号：61877041

批准年份：2018

资助金额：50.00

项目类别：面上项目

批准号：61402498

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：81401785

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：81702472

批准年份：2017

资助金额：21.00

项目类别：青年科学基金项目

批准号：21573172

批准年份：2015

资助金额：64.00

项目类别：面上项目

相似国自然基金

矿床领域文本数据挖掘与知识图谱构建

批准号：41902305

批准年份：2019

负责人：王成彬

学科分类：D0215

资助金额：27.00

项目类别：青年科学基金项目

智能规划中领域知识获取和知识推理算法的研究

批准号：60773201

批准年份：2007

负责人：姜云飞

学科分类：F0607

资助金额：28.00

项目类别：面上项目

从关系数据库中提取领域知识的自动知识获取研究

批准号：68975025

批准年份：1989

负责人：吴信东

学科分类：F0607

资助金额：3.50

项目类别：面上项目

大规模知识图谱的分布式表示学习、知识获取与推理应用

批准号：61572273

批准年份：2015

负责人：刘知远

学科分类：F0211

资助金额：67.00

项目类别：面上项目

稀疏样本条件下的领域知识图谱获取与利用研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

智能煤矿建设路线与工程实践

近红外光响应液晶弹性体

口腔扁平苔藓研究热点前沿的可视化分析

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

区块链技术:从数据智能到知识自动化

赵翔的其他基金

富勒烯及其衍生物的形成机制与光伏特性

基于并行多智能体人工免疫算法的土地利用空间优化模型研究

富勒烯的生成机理及热力学稳定性的理论研究

P2SA 介导PHOT2调节拟南芥下胚轴向光弯曲机制分析

电大尺寸系统电磁效应的系综表述和非确定性评估方法的研究

系统级电磁环境效应中的高频场线耦合分析及应用

用傅立叶变换回旋共振质谱研究气相离子-分子反应

微尺度压电层合细长结构热力电多场耦合动力学行为

拟南芥P2SA4整合强蓝光和糖信号调节下胚轴向光弯曲的机制分析

纳米金刚石的组装规律与分散性质研究

拟南芥ABC转运蛋白P2SA1介导强蓝光诱导下胚轴向光弯曲的机制分析

混响室的概率统计模型及其在随机电磁环境模拟中的应用

大规模图数据管理中结构相似度查询处理技术研究

FBXL2介导TRAF6泛素化降解在声动效应（SE）防治关节假体炎性松动中的机制研究

长链非编码RNA LINC01296对神经母细胞瘤自发消退的影响及其机制研究

内嵌金属富勒烯结构和化学反应性的理论研究

相似国自然基金