基于pay-as-you-go模式的海量RDF图数据的关键词查询

基本信息
批准号:61862010
项目类别:地区科学基金项目
资助金额:40.00
负责人:潘颖
学科分类:
依托单位:南宁师范大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:蒋雪玲,石亚冰,戴智鹏,苏杨茜,顾阳,李敏,李华
关键词:
关键词查询RDF图大数据payasyougo
结项摘要

With the emergence of massive RDF data, query over massive RDF data has become the important issues in the field of Big Data. However, the existing research has ignored the ambiguity of keyword query, and the support for dynamic data query. To address above problems, this research project will focus on keyword query processing and optimization over massive RDF graph data in a pay-as-you-go fashion. First of all, the dynamic evolution algorithm of RDF graphs is presented by analyzing the characteristics of RDF data evolution, and then the evolutionary computation algorithm is proposed, after which, the appropriate data constraints are defined to ensure the accuracy and consistency of data description in the dynamic evolution of RDF graphs. Secondly, under the guidance of dynamic evolution mechanism, an approach based on pay-as-you-go fashion to annotate semantic description in RDF graphs is also proposed. Through data mining and user feedback, this approach determines the key information (e.g., key nodes and key edges) which affect the query result, and then the distributed parallel computing environment is constructed to extract the changes of key information to enhance RDF semantics incrementally. Thirdly, RDF's query algebra based on the query theory of graph structure model is studied, which supports the association query based on the edge (data association), and then the distributed delay calculation method is designed to realize the pay-as-you-go keyword query. Finally, the validity of the work in this project is examined by the evaluation mechanism which combines investment income theory and information retrieval evaluation method.

随着海量RDF数据的涌现,如何准确、快速的查询RDF数据成为大数据研究领域急需解决的重要课题。针对现有研究存在的缺乏支持动态数据查询、查询语义歧义性大的难题,本项目拟研究面向海量RDF图数据的pay-as-you-go(PAYG)模式关键词查询。首先从机理上探究RDF图动态演化过程,研究演化计算方法,定义合适的数据约束保证RDF图动态演化时数据描述的准确性和一致性。其次,以该动态演化机理为指导,设计PAYG模式语义动态添加方法:通过数据挖掘、用户反馈等方式判断影响查询效果的关键信息(如关键节点、关键边),通过增量提取关键信息的变化内容来渐进增强RDF语义的描述。同时,借鉴图结构模型的查询理论构建RDF图查询代数,支持以边(数据关联)为基础的关联查询,设计分布式延迟计算方法实现PAYG模式关键词查询。最后融合投资收益理论和信息检索评价方法,构建PAYG模式关键词查询的评估机制。

项目摘要

随着海量RDF数据的涌现,如何准确、快速的查询RDF数据成为大数据研究领域急需解决的重要课题。针对现有研究存在的缺乏支持动态数据查询、查询语义歧义性大的难题,本项目研究了面向海量RDF图数据的pay-as-you-go(PAYG)模式关键词查询,顺利完成原定计划,取得了预期的效果,具体工作如下:1)研究了RDF图动态演化过程及其演化计算方法。2)设计了PAYG模式语义动态添加方法,通过增量提取关键信息的变化内容来渐进增强RDF语义的描述。3)构建RDF图查询代数,支持以边(数据关联)为基础的关联查询,设计分布式延迟计算方法实现PAYG模式关键词查询。4)构建了PAYG模式关键词查询的评估机制,对上述工作进行改进和优化。本项目的研究能够提高海量RDF图的查询性能,对图模型的查询研究有一定的借鉴和参考价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
3

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

相似国自然基金

1

基于图数据库理论的海量RDF数据存储和查询方法研究

批准号:61003009
批准年份:2010
负责人:邹磊
学科分类:F0202
资助金额:19.00
项目类别:青年科学基金项目
2

海量RDF图数据的分布式存储与查询算法研究

批准号:61602354
批准年份:2016
负责人:李贺
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目
3

Web规模RDF图数据的高效率路径查询及推理研究

批准号:61100049
批准年份:2011
负责人:王鑫
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目
4

云计算环境下基于图模型的海量RDF数据管理关键技术研究

批准号:61502504
批准年份:2015
负责人:卢卫
学科分类:F0202
资助金额:22.00
项目类别:青年科学基金项目