特定领域实体关系获取与实体链接

基本信息
批准号:61562052
项目类别:地区科学基金项目
资助金额:39.00
负责人:郭剑毅
学科分类:
依托单位:昆明理工大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:王红斌,张志坤,文永华,陈玮,洪旭东,邵发,尚琪,汪沛,刘丽佳
关键词:
知识库实体链接实体关系特定领域知识获取
结项摘要

It is the key point and difficult to extract the domain-specific entity relation and to link them,which is the basis for the domain-specific knowledge graph to be used.The research take the Chinese entity as the object.The research can effectively deal with many tackled problems,such as the entity hierarchical relationship obtaining、the entity relationship obtaining and entity linkage which domain-specific knowledge graph building are faced with. On the aspect of the domain concept hierarchical relations obtaining, proposed a method combined with LDA and MLN, firstly ,using topic models to find the distribution of candidate features of areas of theme and concept, then by use of the advantage of the MLN to correlate features with an entity hierarchy; in the field of entity relations learning, proposed the DBN-based and incorpration of domain knowledge into entity-relationship deep learning model ,which can solve complex field samples relation extraction problem and does not depend on artificial selection feature; in entity linkage , proposed the method based on the model PSL( probability of soft logic) to Link entity, through domain knowledge and entity attributes related feature modeling, combined with the knowledge of the ambiguity entity disambiguation can realize the entity links..The research achievement will be applied to domain knowledge learning platform and contribute to promoting the construction and application of the domain knowledge graph.

特定领域实体关系的获取与实体链接是领域知识库构建中的关键部分和难点,也是领域知识图谱走向应用的基础。本课题以中文为对象,研究能有效处理特定领域知识图谱构建所面临的领域概念层级关系、实体关系获取和实体链接等关键技术。在领域概念层级关系获取方面,提出融合LDA和MLN模型的方法,利用主题模型发现领域主题及概念的分布候选特征集,再利用MLN关联特征的优势识别出实体层级关系;在领域实体关系学习方面,提出基于深度信任网并融合领域知识的实体关系深度学习方法,能够解决领域复杂样本的关系抽取问题且不依赖人工选择特征;在领域实体连接方面,提出基于概率软逻辑模型的实体链接方法,通过对领域知识和实体属性等相关特征建模,联合这些知识对歧义实体消歧,实现领域实体的知识库链接,研究成果将用于领域知识库学习平台,有助于推动领域知识图谱构建与应用。

项目摘要

项目面向特定领域实体关系的获取与实体链接的关键问题,围绕领域概念层级关系,领域实体关系学习及领域实体链接等方面开展深入研究,取得以下成果:在领域概念层级关系识别方面,针对复杂命名实体识别问题,提出一种基于最大熵模型的命名实体识别方法,为开展领域层级关系研究提供了技术支撑,针对中文复杂句中实体上下位关系抽取困难的问题,提出基于CRFs的多特征模板实体上下位关系识别方法,根据领域上下位概念实体语义、语法相近的特性,提出一种结合词向量和Bootstrapping的领域实体上下位关系的识别方法。在领域实体属性关系抽取方面,针对人工选取分类特征困难的问题,提出基于深度信念网络的领域实体属性关系抽取方法,实现分类特征自动抽取;针对特定领域实体属性关系识别中的知识迁移问题,提出融合FastText词向量和字向量的基于双向GRU远程监督的中文领域实体属性关系抽取方法;在领域实体关系抽取方面,针对不同核函数对相同特征的抽取性能差异性的问题,提出多核函数融合的领域实体关系抽取方法;针对领域实体关系数据标注困难的问题,提出融合多特征的远程监督抽取领域实体关系方法。在领域实体链接方面,针对传统词向量一词多义的问题,结合文档上下文信息,提出融合词向量和主题模型的领域实体消歧方法;针对中文实体一对一的实体链接效率低的问题,提出一种融合词向量的主题图模型及语义重要性排序的中文集成实体链接方法;针对领域实体链接缺乏领域知识信息的问题,提出了基于关系指数和表示学习的领域集成实体链接方法。基于以上成果,构建涵盖旅游景点、野生菌、茶叶、中国及云南少数民族、小吃、药材、交通方式和住宿等7大领域的知识图谱原型。项目在国内外核心期刊或会议发表论文13篇,其中EI收录5篇,申请发明专利9项,其中授权2项。研究成果将为领域知识图谱构建提供技术支撑。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
4

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020
5

知识产权保护执法力度、技术创新与企业绩效 — 来自中国上市公司的证据

知识产权保护执法力度、技术创新与企业绩效 — 来自中国上市公司的证据

DOI:
发表时间:2016

郭剑毅的其他基金

批准号:61262041
批准年份:2012
资助金额:43.00
项目类别:地区科学基金项目

相似国自然基金

1

命名实体消歧与多源实体知识获取方法研究

批准号:61370117
批准年份:2013
负责人:王厚峰
学科分类:F0211
资助金额:81.00
项目类别:面上项目
2

开放获取生物医学文献的实体关系抽取

批准号:61602207
批准年份:2016
负责人:丰小月
学科分类:F0607
资助金额:20.00
项目类别:青年科学基金项目
3

基于大众参与的语义Web实体链接方法研究

批准号:61370019
批准年份:2013
负责人:胡伟
学科分类:F0203
资助金额:78.00
项目类别:面上项目
4

面向知识库的实体链接技术研究

批准号:61502253
批准年份:2015
负责人:沈玮
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目