Knowledge graph (KG) technology is an effective means of acquiring knowledge from unstructured (including semi-structured) and structured data, which is an important approach towards big data analytics and application. Research in knowledge engineering re-attained the focus due to the introduction of KG, and plays a more and more crucial role in intelligent information services, including information retrieval and automatic question answering. Domain KG differs from general-purpose KG in the scarcity of sample data, which results in that the existing learning models that requires abundant tagged samples cannot be immediately applied, or deteriorates remarkably. Through in-depth analysis of application scenarios of large-scale KG’s, this project plans to carry out research on data-driven domain KG harvest (including extraction, derivation and fusion) and utilization. It will address the problems and challenges in domain knowledge extraction under scarce sample constraints, domain knowledge derivation from general-purpose KG’s, multi-source heterogeneous domain knowledge fusion, and domain knowledge-integrated intelligent information services. It will propose a set of fundamental theories and key technologies for domain KG harvest and utilization; meanwhile, it plans to take military operation as target domain, and conduct experimental evaluation of the proposed models and methods. This research is to promote the practicality of automatic harvest and effective utilization of domain KG’s, and thus, is of great scientific significance and application value.
知识图谱技术是一种从非结构化(含半结构化)数据和结构化数据中获取知识的有效手段,是大数据分析与应用的重要途径之一。知识工程领域的研究因知识图谱的出现再度成为关注点,并在信息检索、自动问答等智能信息服务中发挥越来越重要的作用。领域知识图谱与通用知识图谱的主要区别在于样本数据的稀疏性,这导致依赖大量标注样本的学习模型无法直接适用或效能显著降低。本项目通过深入分析大规模知识图谱的运用场景,拟在数据驱动的领域知识图谱的获取(包括抽取、提取和融合)及利用上开展研究,解决稀疏样本条件下的领域知识抽取、通用知识图谱上的领域知识提取、多来源异构的领域知识图谱融合和集成领域知识的智能化信息服务方面的问题与挑战,建立一套面向领域知识图谱获取与利用的基础理论和关键技术;同时,拟选定军事作战领域作为目标领域,开展模型与方法的实验验证。研究将推动实用化的领域知识图谱自动获取与高效利用,具有重要的科学意义和应用价值。
知识图谱技术是一种从非结构(含半结构化)数据和结构化数据中获得知识的有效手段,是大数据分析与应用的重要途径之一。知识工程领域的研究因知识图谱的出现再度成为关注点,并在信息检索、自动问答等智能信息服务中发挥越来越重要的作用。领域知识图谱与通用知识图谱的主要区别在于样本数据的稀疏性,这导致依赖大量标注样本的学习模型无法直接适用或效能显著降低。本项目深入分析大规模知识图谱的运用场景,建立一套面向领域知识图谱获取与利用的基础理论和关键技术,研究稀疏样本约束的实体关系联合抽取问题,提出基于平移排序模型的结构化知识抽取技术和面向含噪数据的中文领域关系抽取技术;研究面向任务相关语料的领域知识表示问题,提出异构信息网络的预训练模型和基于元图的动态异构信息网络的可扩展表示学习;研究基于有限信息的异构领域知识融合问题,提出基于图分割的大规模实体对齐模型、基于度感知特征融合的实体对齐模型;研究领域知识驱动的弱监督式机器学习问题,提出基于子图推理的时序知识图谱问答方法和基于提问学习的不可回答问题归因方法。同时,选定军事作战领域作为目标领域,开展模型与方法的实验验证。研究或推动实用化的领域知识图谱自动获取与高效利用,具有重要的科学意义和应用价值。在本项目支持下,团队共发表和录用67篇论文,其中CCF A类论文19篇,CCF B类论文16篇,ACM/IEEE Transactions论文7篇,24篇被SCI或待SCI检索;获得授权国家发明专利20项,申请国家发明专利49项。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
基于二维材料的自旋-轨道矩研究进展
服务经济时代新动能将由技术和服务共同驱动
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
矿床领域文本数据挖掘与知识图谱构建
智能规划中领域知识获取和知识推理算法的研究
从关系数据库中提取领域知识的自动知识获取研究
大规模知识图谱的分布式表示学习、知识获取与推理应用