关联数据上基于图的分布式查询处理技术研究

基本信息
批准号:61702171
项目类别:青年科学基金项目
资助金额:20.00
负责人:彭鹏
学科分类:
依托单位:湖南大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:李军义,周四望,李文杰,欧露,徐洋,胡玉涵,刘路
关键词:
RDF数据管理图数据库关联数据分布式查询处理图搜索
结项摘要

As the principles of Linked Data have been widely accepted, there are an increasing number of datasets linked into Linked Data. The datasets linked into Linked Data include the RDF datasets like DBPedia which can be fully downloaded and managed, the RDF datasets like FOAF which cannot be fully downloaded and managed and the relational datasets like IMDB. The complex distributed data environment over Linked Data poses a great challenge for efficiently query processing. Therefore, we study graph-based distributed query processing over Linked Data. First, we study SPARK-based query processing over RDF datasets which can be fully downloaded and managed, and the graph-based query decomposition and optimization techniques that we plan to study can reduce the number of iterations during the query processing in SPARK. We also study graph exploration-based query processing over RDF datasets which cannot be fully downloaded and managed, and we will utilize the structural information to avoid redundant computation. Last, for the relational datasets in Linked Data, we study graph-based query rewriting and optimization to reduce the number of intermediate results. Our research can propose theories and techniques for query processing over Linked Data, and significantly promote the development of Linked Data.

随着关联数据(Linked Data)理念被广泛接受,大量数据被接入关联数据。这其中既包括如DBPedia的能完全下载与管理的RDF数据,也包括如FOAF的难以完全下载与管理的RDF数据,还有如IMDB的接入关联数据的关系数据。关联数据上如此复杂的分布式数据环境为高效的查询处理提出了挑战。为此,本项目以图理论为基础,研究关联数据上分布式查询处理技术。本项目首先将研究利用最新云计算框架SPARK对能完全下载与管理的RDF数据进行查询处理,拟研究的技术将基于查询的图结构来进行查询分解与优化以降低SPARK运算的迭代次数。本项目还将研究利用图探索技术来查询难以完全下载与管理的RDF数据,此研究能利用图结构信息来避免重复计算。最后,对接入关联数据的关系数据,本项目将研究基于图结构的查询重写与优化策略以减少中间结果。本项目的研究将为关联数据上查询处理提供理论方法和技术,对推动关联数据发展有重要意义。

项目摘要

随着关联数据(Linked Data)理念被广泛接受,大量数据被接入关联数据。这其中既包括能完全下载与管理的RDF数据,也包括难以完全下载与管理的RDF数据,还有整合了关系数据的RDF数据。关联数据上如此复杂的分布式数据环境为高效的查询处理提出了挑战。为此,本项目以图理论为基础,研究关联数据上分布式查询处理技术。本项目首先对能完全下载与管理的RDF数据研究了基于查询日志进行数据划分的分布式RDF数据管理技术。针对难以完全下载与管理的RDF数据,本研究提出了基于局部计算的分布式RDF数据管理技术。最后,对整合了关系数据的RDF数据,本项目研究了联邦型分布式RDF数据库上的查询与检索技术。本项目的研究将为关联数据上查询处理提供理论方法和技术,对推动关联数据发展有重要意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

彭鹏的其他基金

批准号:51871118
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:81860335
批准年份:2018
资助金额:34.00
项目类别:地区科学基金项目
批准号:51605019
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51501082
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:21702125
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:11904217
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:81460260
批准年份:2014
资助金额:47.00
项目类别:地区科学基金项目
批准号:81760305
批准年份:2017
资助金额:33.00
项目类别:地区科学基金项目
批准号:61901510
批准年份:2019
资助金额:24.50
项目类别:青年科学基金项目
批准号:41504066
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

图模型大数据的分布式查询处理关键技术研究

批准号:61572353
批准年份:2015
负责人:王鑫
学科分类:F0202
资助金额:67.00
项目类别:面上项目
2

基于分布式流处理的动态图在线查询技术研究

批准号:61702320
批准年份:2017
负责人:杨定裕
学科分类:F0202
资助金额:19.00
项目类别:青年科学基金项目
3

基于大规模图数据的可达性查询处理技术

批准号:61873337
批准年份:2018
负责人:陈子阳
学科分类:F0310
资助金额:63.00
项目类别:面上项目
4

基于分布式计算框架的大图数据描述性查询关键技术研究

批准号:61272156
批准年份:2012
负责人:高军
学科分类:F0202
资助金额:82.00
项目类别:面上项目