云计算中TB/PB级海量数据近似查询处理技术的研究

基本信息
批准号:61272046
项目类别:面上项目
资助金额:80.00
负责人:杨东华
学科分类:
依托单位:哈尔滨工业大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:韩希先,王金宝,于博,苑野
关键词:
TB/PB级海量数据查询优化近似查询处理云计算
结项摘要

The research on query processing techniques for TB/PB massive datasets in cloud computing is first carried out at home and abroad supported by NSFC. Some key theories and technologies of exact query processing for TB/PB massive datasets are proposed. So far, 12 papers have been published on well-known domestic and international journals and conferences (3 papers on international journals, 1 paper on an international conference, 4 papers on top domestic journals, 4 papers on domestic conferences), including 3 papers indexed by SCI and 8 papers indexed by EI. Otherwise, 5 papers are submitted to top international journals and conferences, including 4 papers to international journals indexed by SCI (2 papers to TKDE) and 1 paper to VLDB 2012. The subject of our project is to study the key theories and techniques of approximate query processing for TB/PB massive datasets in cloud computing, including storage and index methods for TB/PB massive datasets; some query processing algorithms for fundamental operations on TB/PB massive datasets such as approximate selection, join and group-by; approximate query processing algorithms for summary information and representation information of TB/PB massive datasets. A query processing prototype system will be developed for TB/PB massive datasets in cloud computing.

青年科学基金项目在国内外率先开展了基于云计算环境的TB/PB级海量数据查询处理的研究工作,主要围绕精确查询处理,提出了一些TB/PB级海量数据查询处理的关键理论和技术。目前还在继续进行这方面的研究工作。到目前为止,已在国内外知名期刊和会议上发表学术论文12篇(国际期刊3篇,国际会议1篇,国内一级期刊4篇,国内会议4篇),其中SCI检索3篇,EI检索8篇。在审文章5篇,其中国际期刊文章4篇(数据库顶级国际期刊TKDE 2篇),数据库顶级国际会议VLDB 2012 1篇。本课题在已有研究成果的基础上,将研究云计算中TB/PB级海量数据近似查询处理的关键技术和理论,主要包括:支持近似查询处理的海量数据存储和索引方法;海量数据近似选择、连接和分组等基础操作算法;海量数据概要信息和代表性信息近似查询处理算法;并研制相应的TB/PB级海量数据近似查询处理系统原型。

项目摘要

近年来,各行业的信息量呈爆炸性增长趋势,一些科学应用中的数据量已经从几十个TeraBytes发展到PetaBytes并且在不断扩大。现有数据管理方法无法提供TB/PB级海量数据有效的存储与查询支持。如何有效地存储、管理这些TB/PB级海量的数据集合,高效地支持各种复杂的查询是数据库领域面临的一个新的挑战性问题。该课题在国内外率先开展了云计算中TB/PB级海量数据近似查询处理的相关研究工作,提出了一些TB/PB级海量数据近似查询处理的关键理论和技术,主要包括支持近似查询处理的海量数据存储和索引方法;海量数据近似连接和近似聚集等基础操作算法;海量数据概要信息和代表性信息近似查询处理算法;并研制了相应的TB/PB级海量数据近似查询处理系统原型用于验证算法的有效性和准确性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

DOI:10.6052/1672⁃6553⁃2017⁃059
发表时间:2018
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

杨东华的其他基金

批准号:60903016
批准年份:2009
资助金额:18.00
项目类别:青年科学基金项目
批准号:58670092
批准年份:1986
资助金额:1.50
项目类别:面上项目
批准号:61772157
批准年份:2017
资助金额:66.00
项目类别:面上项目

相似国自然基金

1

基于云计算环境的TB/PB级海量数据查询处理技术的研究

批准号:60903016
批准年份:2009
负责人:杨东华
学科分类:F0202
资助金额:18.00
项目类别:青年科学基金项目
2

云计算环境下海量数据查询优化与智能处理的研究

批准号:61173162
批准年份:2011
负责人:李克秋
学科分类:F0207
资助金额:58.00
项目类别:面上项目
3

海量移动对象上的近似聚集查询处理技术

批准号:60673134
批准年份:2006
负责人:钱卫宁
学科分类:F0202
资助金额:27.00
项目类别:面上项目
4

面向计算密集型的海量数据查询处理关键技术研究

批准号:61100060
批准年份:2011
负责人:丁晓锋
学科分类:F0202
资助金额:22.00
项目类别:青年科学基金项目