稀疏样本条件下的领域知识图谱获取与利用研究

基本信息
批准号:61872446
项目类别:面上项目
资助金额:66.00
负责人:赵翔
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:王晖,蔡飞,唐国明,张啸宇,陈一帆,谭真,李瑞琪,曾维新,王炜
关键词:
数据驱动知识库领域知识图谱
结项摘要

Knowledge graph (KG) technology is an effective means of acquiring knowledge from unstructured (including semi-structured) and structured data, which is an important approach towards big data analytics and application. Research in knowledge engineering re-attained the focus due to the introduction of KG, and plays a more and more crucial role in intelligent information services, including information retrieval and automatic question answering. Domain KG differs from general-purpose KG in the scarcity of sample data, which results in that the existing learning models that requires abundant tagged samples cannot be immediately applied, or deteriorates remarkably. Through in-depth analysis of application scenarios of large-scale KG’s, this project plans to carry out research on data-driven domain KG harvest (including extraction, derivation and fusion) and utilization. It will address the problems and challenges in domain knowledge extraction under scarce sample constraints, domain knowledge derivation from general-purpose KG’s, multi-source heterogeneous domain knowledge fusion, and domain knowledge-integrated intelligent information services. It will propose a set of fundamental theories and key technologies for domain KG harvest and utilization; meanwhile, it plans to take military operation as target domain, and conduct experimental evaluation of the proposed models and methods. This research is to promote the practicality of automatic harvest and effective utilization of domain KG’s, and thus, is of great scientific significance and application value.

知识图谱技术是一种从非结构化(含半结构化)数据和结构化数据中获取知识的有效手段,是大数据分析与应用的重要途径之一。知识工程领域的研究因知识图谱的出现再度成为关注点,并在信息检索、自动问答等智能信息服务中发挥越来越重要的作用。领域知识图谱与通用知识图谱的主要区别在于样本数据的稀疏性,这导致依赖大量标注样本的学习模型无法直接适用或效能显著降低。本项目通过深入分析大规模知识图谱的运用场景,拟在数据驱动的领域知识图谱的获取(包括抽取、提取和融合)及利用上开展研究,解决稀疏样本条件下的领域知识抽取、通用知识图谱上的领域知识提取、多来源异构的领域知识图谱融合和集成领域知识的智能化信息服务方面的问题与挑战,建立一套面向领域知识图谱获取与利用的基础理论和关键技术;同时,拟选定军事作战领域作为目标领域,开展模型与方法的实验验证。研究将推动实用化的领域知识图谱自动获取与高效利用,具有重要的科学意义和应用价值。

项目摘要

知识图谱技术是一种从非结构(含半结构化)数据和结构化数据中获得知识的有效手段,是大数据分析与应用的重要途径之一。知识工程领域的研究因知识图谱的出现再度成为关注点,并在信息检索、自动问答等智能信息服务中发挥越来越重要的作用。领域知识图谱与通用知识图谱的主要区别在于样本数据的稀疏性,这导致依赖大量标注样本的学习模型无法直接适用或效能显著降低。本项目深入分析大规模知识图谱的运用场景,建立一套面向领域知识图谱获取与利用的基础理论和关键技术,研究稀疏样本约束的实体关系联合抽取问题,提出基于平移排序模型的结构化知识抽取技术和面向含噪数据的中文领域关系抽取技术;研究面向任务相关语料的领域知识表示问题,提出异构信息网络的预训练模型和基于元图的动态异构信息网络的可扩展表示学习;研究基于有限信息的异构领域知识融合问题,提出基于图分割的大规模实体对齐模型、基于度感知特征融合的实体对齐模型;研究领域知识驱动的弱监督式机器学习问题,提出基于子图推理的时序知识图谱问答方法和基于提问学习的不可回答问题归因方法。同时,选定军事作战领域作为目标领域,开展模型与方法的实验验证。研究或推动实用化的领域知识图谱自动获取与高效利用,具有重要的科学意义和应用价值。在本项目支持下,团队共发表和录用67篇论文,其中CCF A类论文19篇,CCF B类论文16篇,ACM/IEEE Transactions论文7篇,24篇被SCI或待SCI检索;获得授权国家发明专利20项,申请国家发明专利49项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
3

基于二维材料的自旋-轨道矩研究进展

基于二维材料的自旋-轨道矩研究进展

DOI:10.7498/aps.70.20210004
发表时间:2021
4

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

赵翔的其他基金

批准号:21773181
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:41401446
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:20673081
批准年份:2006
资助金额:30.00
项目类别:面上项目
批准号:31101023
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:60801035
批准年份:2008
资助金额:25.00
项目类别:青年科学基金项目
批准号:U1530143
批准年份:2015
资助金额:63.00
项目类别:联合基金项目
批准号:20073054
批准年份:2000
资助金额:15.00
项目类别:面上项目
批准号:11702230
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:31871419
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:21171138
批准年份:2011
资助金额:55.00
项目类别:面上项目
批准号:31570294
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:61877041
批准年份:2018
资助金额:50.00
项目类别:面上项目
批准号:61402498
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:81401785
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81702472
批准年份:2017
资助金额:21.00
项目类别:青年科学基金项目
批准号:21573172
批准年份:2015
资助金额:64.00
项目类别:面上项目

相似国自然基金

1

矿床领域文本数据挖掘与知识图谱构建

批准号:41902305
批准年份:2019
负责人:王成彬
学科分类:D0215
资助金额:27.00
项目类别:青年科学基金项目
2

智能规划中领域知识获取和知识推理算法的研究

批准号:60773201
批准年份:2007
负责人:姜云飞
学科分类:F0607
资助金额:28.00
项目类别:面上项目
3

从关系数据库中提取领域知识的自动知识获取研究

批准号:68975025
批准年份:1989
负责人:吴信东
学科分类:F0607
资助金额:3.50
项目类别:面上项目
4

大规模知识图谱的分布式表示学习、知识获取与推理应用

批准号:61572273
批准年份:2015
负责人:刘知远
学科分类:F0211
资助金额:67.00
项目类别:面上项目