随着语义网概念的推广及应用的不断增多,语义数据的规模也在急剧增长,因此海量语义数据管理成为了一项热点研究领域。本项目以图数据库理论为基础,研究和实现面向海量RDF(Resource Description Framework,资源描述框架)数据的存储和查询的方法。具体的研究内容包括:基于图模型的RDF数据的存储策略,索引结构和查询算法,以及构建统一的测试平台。本项目所考虑的RDF数据上的查询类型包括"子图匹配查询","路径查询"和"关键词查询"。这些查询不仅涵盖而且扩展了目前的RDF数据上的查询语言(即SPARQL语言)的语义。在项目的研究中,我们拟设计的存储和查询方法具有可扩展性好,动态维护代价低,以及查询语义丰富三个方面的特点。
随着语义网概念的推广及应用的不断增多,RDF语义数据的规模也在急剧增长,因此海量RDF语义数据的管理成为了海量数据管理领域一项热点的研究话题。传统的RDF数据管理以关系数据库为基础,研究如何将RDF的三元组表拆分成多个关系表,从而将面向RDF的SPARQL查询转换为面向关系表的SQL查询。这种方法忽略了RDF图数据的结构特点,从而其查询效率比较低。本项目从RDF图数据的特点出发,提出了利用RDF图结构来设计面向RDF的查询方法和索引结构。具体的,在本课题的研究过程中,我们研究了三类典型的查询“子图匹配查询”,“路径查询”和“关键词查询”。..我们提出了利用子图匹配的算法来回答面向RDF的SPARQL查询的问题,同时基于此提出了VS*-tree索引结构,极大地减小了查询的搜索空间。我们研发了基于子图匹配的SPARQL查询引擎gStore,其相关研究成果发表在数据库领域顶级国际会议和期刊VLDB 2011和VLDB Journal上。..RDF图中边对应RDF三元组中的属性(Property)。传统的图上的可达性查询是不考虑RDF图上的边的标签信息的。本课题考虑到RDF边上的属性的特点,我们提出了基于标签的可达性查询的算法。其研究成果发表在数据库领域重要国际会议和期刊CIKM 2011和Information System上。..同时为了解决RDF上的关键词查询问题,我们提出了“关键词图(Keyword Graph)”的概念,将每个关键词表示为图中的节点,将关键词之间的共现关系表示关键词图中的边。在关键词图中的关键词查询可以有效地提出关键词查询的性能。其研究成果发表在数据库领域国际会议ADMA 2013。同时该论文的扩展版本被ADMA 2013推荐到国际期刊发表。..本课题研究过程中,我们发表了相关学术论文16篇,其中计算机学会推荐的顶级(A类)期刊/会议论文5篇,包括VLDB Journal, TKDE, VLDB等。本项目所发表的论文,目前已被国内外同行引用61次(根据Google Scholar统计)。在研究成果的产业化应用方面,本课题的研究成果获得授权专利3项;目前已经和搜狗等相关企业就本课题研究中成果(基于图的RDF查询引擎gStore)的工业化应用签订了两年合作开发协议。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于全模式全聚焦方法的裂纹超声成像定量检测
海量RDF图数据的分布式存储与查询算法研究
基于pay-as-you-go模式的海量RDF图数据的关键词查询
云计算环境下基于图模型的海量RDF数据管理关键技术研究
基于RDF的软件工程数据存储与检索技术研究