With the development of Semantic Web technologies, RDF graph datasets formed by various data sources in the Web are growing exponentially. Since the structure of RDF data is graph and the size is always large, the existed data management methods are no longer suitable for increasing large RDF graph data. In this project, we will study the problems of RDF data in distributed storage frameworks. The key technologies of this project are as follows. First, we will study the effects of graph partitioning method to SPARQL query processing and propose a streaming graph partitioning algorithm to support large RDF data in distributed storage frameworks. Second, we will study RDF graph index in distributed storage frameworks and propose a multi-layer index method to support efficient SPARQL query processing . Finally, we will study the optimal parallel SPARQL query processing in distributed environments based on graph pattern decomposing and merging.
随着语义网技术的不断发展与推广,以互联网上的各种数据资源构成的RDF图数据集合正以指数形式飞速增长。由于RDF数据规模庞大且具有复杂多变的图结构特征,传统的数据存储与查询方式已经不能满足日益增长的大规模RDF图数据的需求。本项目针对大规模RDF图数据在分布式存储框架上的存储与查询问题展开研究,主要内容包括以下几点:(1)研究图数据划分算法对分布式RDF图数据存储与查询的影响,根据图的连通性提出一种支持大规模RDF图数据的数据流划分算法,使RDF图数据能够合理有效地存储在分布式存储框架上;(2)研究分布式环境中的RDF图数据索引技术,通过分析RDF数据的语义特征和SPARQL查询模式提出一种多层的图结构索引来提高大规模RDF图数据的查询效率;(3)研究并行的SPARQL查询优化算法,采用SPARQL查询模式分解和重组的方式设计分布式环境中并行的SPARQL查询优化处理算法。
随着语义网技术的不断发展与推广,以互联网上的各种数据资源构成的RDF图数据集合正以指数形式飞速增长。由于RDF数据规模庞大且具有复杂多变的图结构特征,传统的数据存储与查询方式已经不能满足日益增长的大规模图数据的需求。本项目针对大规模图数据在分布式存储框架上的存储与查询问题展开研究,主要研究内容包括以下几点:1)对数据流处理模式进行分析并根据语义图数据特征以图理论为基础进行建模,提出具体的语义图划分算法模型,设计算法并进行了实验验证;2)根据得到的图划分结果,利用组合优化的方法设计动态图在分布式环境中的数据复制和动态维护方法,提升分布式环境中的图数据管理效率;3)对语义图数据进行查询优化算法的设计和实现,由于语义图数据是一种特殊的异构图结构,我们通过定义异构图中的元结构和元路径来提升异构图数据上的查询效率。本项目的研究涉及图理论、数据库理论、信息检索、大规模复杂数据处理等领域,不但具有深刻的科学理论研究价值, 也可以被广泛地应用到许多实际应用领域。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
基于图数据库理论的海量RDF数据存储和查询方法研究
基于pay-as-you-go模式的海量RDF图数据的关键词查询
大规模模糊RDF数据存储与查询关键技术研究
Web规模RDF图数据的高效率路径查询及推理研究