基于图数据库理论的海量RDF数据存储和查询方法研究

基本信息
批准号:61003009
项目类别:青年科学基金项目
资助金额:19.00
负责人:邹磊
学科分类:
依托单位:北京大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:赵东岩,王栋,彭鹏,陈岩光,王伟,刘艳珠
关键词:
图数据库索引结构查询算法存储模式RDF数据
结项摘要

随着语义网概念的推广及应用的不断增多,语义数据的规模也在急剧增长,因此海量语义数据管理成为了一项热点研究领域。本项目以图数据库理论为基础,研究和实现面向海量RDF(Resource Description Framework,资源描述框架)数据的存储和查询的方法。具体的研究内容包括:基于图模型的RDF数据的存储策略,索引结构和查询算法,以及构建统一的测试平台。本项目所考虑的RDF数据上的查询类型包括"子图匹配查询","路径查询"和"关键词查询"。这些查询不仅涵盖而且扩展了目前的RDF数据上的查询语言(即SPARQL语言)的语义。在项目的研究中,我们拟设计的存储和查询方法具有可扩展性好,动态维护代价低,以及查询语义丰富三个方面的特点。

项目摘要

随着语义网概念的推广及应用的不断增多,RDF语义数据的规模也在急剧增长,因此海量RDF语义数据的管理成为了海量数据管理领域一项热点的研究话题。传统的RDF数据管理以关系数据库为基础,研究如何将RDF的三元组表拆分成多个关系表,从而将面向RDF的SPARQL查询转换为面向关系表的SQL查询。这种方法忽略了RDF图数据的结构特点,从而其查询效率比较低。本项目从RDF图数据的特点出发,提出了利用RDF图结构来设计面向RDF的查询方法和索引结构。具体的,在本课题的研究过程中,我们研究了三类典型的查询“子图匹配查询”,“路径查询”和“关键词查询”。..我们提出了利用子图匹配的算法来回答面向RDF的SPARQL查询的问题,同时基于此提出了VS*-tree索引结构,极大地减小了查询的搜索空间。我们研发了基于子图匹配的SPARQL查询引擎gStore,其相关研究成果发表在数据库领域顶级国际会议和期刊VLDB 2011和VLDB Journal上。..RDF图中边对应RDF三元组中的属性(Property)。传统的图上的可达性查询是不考虑RDF图上的边的标签信息的。本课题考虑到RDF边上的属性的特点,我们提出了基于标签的可达性查询的算法。其研究成果发表在数据库领域重要国际会议和期刊CIKM 2011和Information System上。..同时为了解决RDF上的关键词查询问题,我们提出了“关键词图(Keyword Graph)”的概念,将每个关键词表示为图中的节点,将关键词之间的共现关系表示关键词图中的边。在关键词图中的关键词查询可以有效地提出关键词查询的性能。其研究成果发表在数据库领域国际会议ADMA 2013。同时该论文的扩展版本被ADMA 2013推荐到国际期刊发表。..本课题研究过程中,我们发表了相关学术论文16篇,其中计算机学会推荐的顶级(A类)期刊/会议论文5篇,包括VLDB Journal, TKDE, VLDB等。本项目所发表的论文,目前已被国内外同行引用61次(根据Google Scholar统计)。在研究成果的产业化应用方面,本课题的研究成果获得授权专利3项;目前已经和搜狗等相关企业就本课题研究中成果(基于图的RDF查询引擎gStore)的工业化应用签订了两年合作开发协议。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
5

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021

邹磊的其他基金

相似国自然基金

1

海量RDF图数据的分布式存储与查询算法研究

批准号:61602354
批准年份:2016
负责人:李贺
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目
2

基于pay-as-you-go模式的海量RDF图数据的关键词查询

批准号:61862010
批准年份:2018
负责人:潘颖
学科分类:F0211
资助金额:40.00
项目类别:地区科学基金项目
3

云计算环境下基于图模型的海量RDF数据管理关键技术研究

批准号:61502504
批准年份:2015
负责人:卢卫
学科分类:F0202
资助金额:22.00
项目类别:青年科学基金项目
4

基于RDF的软件工程数据存储与检索技术研究

批准号:60803022
批准年份:2008
负责人:宫学庆
学科分类:F0202
资助金额:18.00
项目类别:青年科学基金项目