海量RDF图数据的分布式存储与查询算法研究

基本信息
批准号:61602354
项目类别:青年科学基金项目
资助金额:21.00
负责人:李贺
学科分类:
依托单位:西安电子科技大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:Rize Jin,蔺一帅,周瑜,徐礼治,吕泽,赵智强,孙晓晶,陈学飞
关键词:
图数据数据查询语义网数据数据存储RDF
结项摘要

With the development of Semantic Web technologies, RDF graph datasets formed by various data sources in the Web are growing exponentially. Since the structure of RDF data is graph and the size is always large, the existed data management methods are no longer suitable for increasing large RDF graph data. In this project, we will study the problems of RDF data in distributed storage frameworks. The key technologies of this project are as follows. First, we will study the effects of graph partitioning method to SPARQL query processing and propose a streaming graph partitioning algorithm to support large RDF data in distributed storage frameworks. Second, we will study RDF graph index in distributed storage frameworks and propose a multi-layer index method to support efficient SPARQL query processing . Finally, we will study the optimal parallel SPARQL query processing in distributed environments based on graph pattern decomposing and merging.

随着语义网技术的不断发展与推广,以互联网上的各种数据资源构成的RDF图数据集合正以指数形式飞速增长。由于RDF数据规模庞大且具有复杂多变的图结构特征,传统的数据存储与查询方式已经不能满足日益增长的大规模RDF图数据的需求。本项目针对大规模RDF图数据在分布式存储框架上的存储与查询问题展开研究,主要内容包括以下几点:(1)研究图数据划分算法对分布式RDF图数据存储与查询的影响,根据图的连通性提出一种支持大规模RDF图数据的数据流划分算法,使RDF图数据能够合理有效地存储在分布式存储框架上;(2)研究分布式环境中的RDF图数据索引技术,通过分析RDF数据的语义特征和SPARQL查询模式提出一种多层的图结构索引来提高大规模RDF图数据的查询效率;(3)研究并行的SPARQL查询优化算法,采用SPARQL查询模式分解和重组的方式设计分布式环境中并行的SPARQL查询优化处理算法。

项目摘要

随着语义网技术的不断发展与推广,以互联网上的各种数据资源构成的RDF图数据集合正以指数形式飞速增长。由于RDF数据规模庞大且具有复杂多变的图结构特征,传统的数据存储与查询方式已经不能满足日益增长的大规模图数据的需求。本项目针对大规模图数据在分布式存储框架上的存储与查询问题展开研究,主要研究内容包括以下几点:1)对数据流处理模式进行分析并根据语义图数据特征以图理论为基础进行建模,提出具体的语义图划分算法模型,设计算法并进行了实验验证;2)根据得到的图划分结果,利用组合优化的方法设计动态图在分布式环境中的数据复制和动态维护方法,提升分布式环境中的图数据管理效率;3)对语义图数据进行查询优化算法的设计和实现,由于语义图数据是一种特殊的异构图结构,我们通过定义异构图中的元结构和元路径来提升异构图数据上的查询效率。本项目的研究涉及图理论、数据库理论、信息检索、大规模复杂数据处理等领域,不但具有深刻的科学理论研究价值, 也可以被广泛地应用到许多实际应用领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

李贺的其他基金

批准号:31101524
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:51904103
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:31872069
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:61901204
批准年份:2019
资助金额:24.50
项目类别:青年科学基金项目
批准号:41473029
批准年份:2014
资助金额:95.00
项目类别:面上项目
批准号:41801353
批准年份:2018
资助金额:26.50
项目类别:青年科学基金项目
批准号:21245007
批准年份:2012
资助金额:10.00
项目类别:专项基金项目
批准号:81000976
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:31100489
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:31801372
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:41807319
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:51905314
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:91958110
批准年份:2019
资助金额:52.00
项目类别:重大研究计划

相似国自然基金

1

基于图数据库理论的海量RDF数据存储和查询方法研究

批准号:61003009
批准年份:2010
负责人:邹磊
学科分类:F0202
资助金额:19.00
项目类别:青年科学基金项目
2

基于pay-as-you-go模式的海量RDF图数据的关键词查询

批准号:61862010
批准年份:2018
负责人:潘颖
学科分类:F0211
资助金额:40.00
项目类别:地区科学基金项目
3

大规模模糊RDF数据存储与查询关键技术研究

批准号:61772269
批准年份:2017
负责人:马宗民
学科分类:F0202
资助金额:62.00
项目类别:面上项目
4

Web规模RDF图数据的高效率路径查询及推理研究

批准号:61100049
批准年份:2011
负责人:王鑫
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目