面向资源型社交网站的知识图谱构建方法研究

基本信息
批准号:61402220
项目类别:青年科学基金项目
资助金额:24.00
负责人:欧阳纯萍
学科分类:
依托单位:南华大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:刘永彬,罗凌云,李智星,张书卿,周文,陈军,李奇
关键词:
资源型社交网站知识图谱信息抽取本体映射
结项摘要

Discovering the implicit knowledge of resource social network sites using semantic technology is useful to enhance user viscosity of social network sites.At the same time, using the knowledge graph to describe the multi-dimension, multi-scale and complete knowledge system is a hot research topic in knowledge engineering field. At present, the two studies are in independent state, therefore, combining these two technologies, and using knowledge graph to reveal implicit knowledge of social network sites resources is a very challenging research topic. Distributed, heterogeneous and non-standardization are the characteristics of Chinese social network sites resources.According to the characteristics,three studies are proposed,including information extraction of non-standardization Chinese information,automatic construction of domain ontology,and heterogeneous ontology mapping,in order to effectively integrate the heterogeneous domain knowledge from different social network sites. The features of this project is as follow: the application of joint inference model in non-standardized Chinese information extraction, which is able to avoid the wrong cascade effectively and improve the accuracy of the whole extraction task; research on a mechanism of multi-strategy ontology mapping based on weighted learning to address the drawback of traditional information extraction method which excessive depends on the composition approach of strategy; the propagation algorithm of mapping results based on ontology structure is put forwarded, to solve the problem of low-frequency semantic loss and improve the completeness of knowledge graph.

利用语义技术发掘社交网站资源信息的知识内涵,对于提升社交网站的用户粘度具有重要的应用价值;同时,利用知识图谱描述多维度、多刻度、完备的知识体系是知识工程领域的研究热点。目前,这两个领域的研究处于相互独立的状态,因此,融合两者的优势,利用知识图谱表示社交网站资源的知识内涵是极具挑战性的研究课题。针对中文社交网站资源信息的分散、异构和非规范化等特点,本项目从非规范化中文信息抽取、领域本体自动构建、异构本体映射三个方面展开知识图谱构建研究,旨在有效地整合多源异构的资源型社交网站上的领域知识。项目特色在于:把联合推理模型应用在非规范化中文信息抽取中,有效地避免了错误的级联放大,保证了整个抽取任务的最大精度;研究基于权值学习的多策略本体映射机制,解决了传统混合映射方法过度依赖组合策略的问题;提出了基于本体结构的映射结果传播算法,解决了低频语义缺失问题,提高了知识图谱的完备性。

项目摘要

以资源为中心的中文社交网站上的数据具有分散、异构、口语化程度高和不确定性的特点,构建基于此类社交网站的知识图谱则面临着三大挑战:如何在这样的数据中抽取出高精度的知识信息是需要解决的第一个挑战;如何利用抽取出的信息,进行领域本体知识建模,发现概念、属性以及概念层次关系,自动或半自动的构建核心本体是面临的第二个挑战;如何将来自不同资源型社交网站的领域本体,利用映射技术集成在一起,最终构建出一个完整的领域知识图谱是最后一个挑战。本项目通过分析中文社交网站中围绕着资源所产生的各种信息,例如对资源的评论,资源的标签等文字信息的语义特征,然后以其为基础探讨中文社交网站资源的信息抽取方法,提出了面向实体抽取、共指消解和领域实体关系抽取任务的联合推理模型;最后,基于多刻面概念相似度计算实现了异构本体之间的映射,统一了知识图谱的语义表达。本项目在理论研究的基础上,积极探索应用实践,以电影类的资源型社交网站为实践对象,构建了一个影视知识图谱,提供了影视知识问答,影视关联搜索、影视数据分析等多项知识服务,为其他领域资源的知识图谱构建奠定了理论和技术基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020
5

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017

欧阳纯萍的其他基金

相似国自然基金

1

面向视频社交网站的视频内容理解与挖掘研究

批准号:61571045
批准年份:2015
负责人:袁家政
学科分类:F0113
资助金额:67.00
项目类别:面上项目
2

面向商务大数据的知识图谱引擎构建方法与关键技术研究

批准号:91846204
批准年份:2018
负责人:陈华钧
学科分类:F0607
资助金额:240.00
项目类别:重大研究计划
3

面向词汇功能的学术文本语义识别与知识图谱构建

批准号:71473183
批准年份:2014
负责人:陆伟
学科分类:G0414
资助金额:66.00
项目类别:面上项目
4

面向开放域数据的情报知识图谱构建技术研究

批准号:U1836108
批准年份:2018
负责人:刘建毅
学科分类:F0202
资助金额:66.00
项目类别:联合基金项目