基于分布式计算框架的大图数据描述性查询关键技术研究

基本信息
批准号:61272156
项目类别:面上项目
资助金额:82.00
负责人:高军
学科分类:
依托单位:北京大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:杨冬青,王悦,闫秋玲,纪腾飞,黄威靖,欧高炎,王林青,付炳楠,周家帅
关键词:
查询优化图查询描述性查询MapReduce
结项摘要

Big graphs and their applications raise enormous challenges and opportunities to database researchers. It is a practical solution to exploit the existing MapReduce framework in managing big graphs to achieve a high scalability. In order to improve the performance of graph query in the MapReduce framework, and lessen the burdens of end uses in coding and debugging distributed programs, this project plans to study the key techniques of declarative query on big graphs using MapReduce framework. Specifically, this project will design a declarative graph query language based on recursive Datalog to ease the burdens of end users, propose a method to construct query evaluation plans using MapReduce, and devise query optimization and dynamic binding strategies based on a cost model. In addition, this project will study the extensions to the underlying MapReduce framework, including the global caching mechanism for iterative invariance in MapReduce job, and adaptive partitioning strategy for load balance in the reduce side. In addition, this project will build a prototype for the declarative graph query language based on Hadoop system, which is an open source implementation of MapReduce framework.

大图数据及其上应用为数据管理技术带来了巨大的挑战和机遇。利用现有相对成熟的MapReduce分布式计算框架管理大图数据是现实可行的技术方案。本课题针对现有框架下大图数据查询性能难以满足应用需求、用户编写图数据处理脚本繁琐低效等问题,围绕MapReduce框架下大图数据描述性查询,从理论方法与关键技术、原型系统两个层面展开研究工作。在理论方法与关键技术层面,本课题拟提出基于递归Datalog的描述性图查询语言,简化最终用户编写图操作脚本的代价;拟提出基于MapReduce框架的描述性图查询执行计划的构建方法,设计基于代价模型的优化和动态绑定策略;拟提出MapReduce框架中面向循环不变量的缓存策略,设计面向负载平衡的任务自适应分配机制,扩展分布式计算框架对大图数据管理的支持。在原型系统层面,本课题基于分布式计算框架MapReduce的开源系统Hadoop研制大图数据描述性查询的原型系统。

项目摘要

大图数据及其上应用为数据管理技术带来了巨大的挑战和机遇。利用现有相对成熟的分布式计算框架管理大图数据是现实可行的技术方案。本课题针对现有框架下大图数据查询性能难以满足应用需求、用户编写图数据处理脚本繁琐低效等问题,围绕分布式框架下大图数据查询和分析,从理论方法与关键技术、原型系统两个层面展开研究工作。在理论方法与关键技术层面,本课题提出了基于递归Datalog的描述性图查询语言,简化最终用户编写图操作脚本的代价;提出了以节点为中心计算模型下的图模式匹配方法,提高模式查询的扩展性,保证查询结果在动态大图之上的有效性,并扩展支持多查询优化;设计了分布式框架的资源优化框架MocGraph,减少框架运行过程中的资源消耗;设计了支持同步和异步操作的分布式大图处理框架GiraphAsync,在统一框架中支持同步图分析和异步图查询。基于上述研究进展,发表或者录用论文12篇,其中CCF A类论文8篇,包括VLDB、ICDE、AAAI、TKDE、VLDBJ等;申请专利1项;研究成果在阿里巴巴公司得到应用,利用千台分布式计算节点分析大图数据支持商品图推荐,取得良好应用效果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
2

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
3

基于混合优化方法的大口径主镜设计

基于混合优化方法的大口径主镜设计

DOI:10.3788/AOS202040.2212001
发表时间:2020
4

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

DOI:10.3901/jme.2020.24.219
发表时间:2020
5

涡轮叶片厚壁带肋通道流动与传热性能的预测和优化

涡轮叶片厚壁带肋通道流动与传热性能的预测和优化

DOI:10.7652/xjtuxb202112004
发表时间:2021

高军的其他基金

批准号:81472279
批准年份:2014
资助金额:70.00
项目类别:面上项目
批准号:61572040
批准年份:2015
资助金额:67.00
项目类别:面上项目
批准号:21873034
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:61471389
批准年份:2014
资助金额:83.00
项目类别:面上项目
批准号:21373124
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:31500891
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:51278370
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:60503037
批准年份:2005
资助金额:24.00
项目类别:青年科学基金项目
批准号:60873062
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:61303099
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:11805230
批准年份:2018
资助金额:23.00
项目类别:青年科学基金项目
批准号:31760654
批准年份:2017
资助金额:38.00
项目类别:地区科学基金项目
批准号:39600172
批准年份:1996
资助金额:9.00
项目类别:青年科学基金项目
批准号:81272663
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:31360539
批准年份:2013
资助金额:53.00
项目类别:地区科学基金项目
批准号:41601140
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:61073018
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:11802297
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:50908163
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:21878178
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:51778440
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:51578387
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:31060298
批准年份:2010
资助金额:25.00
项目类别:地区科学基金项目

相似国自然基金

1

图模型大数据的分布式查询处理关键技术研究

批准号:61572353
批准年份:2015
负责人:王鑫
学科分类:F0202
资助金额:67.00
项目类别:面上项目
2

基于频繁更新的大图数据查询和管理技术研究

批准号:61472427
批准年份:2014
负责人:陆嘉恒
学科分类:F0202
资助金额:80.00
项目类别:面上项目
3

关联数据上基于图的分布式查询处理技术研究

批准号:61702171
批准年份:2017
负责人:彭鹏
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
4

大规模图数据正则路径查询关键技术研究

批准号:60873062
批准年份:2008
负责人:高军
学科分类:F0202
资助金额:32.00
项目类别:面上项目