大数据高效能存储与管理方法研究

基本信息
批准号:U1435216
项目类别:联合基金项目
资助金额:105.00
负责人:武永卫
学科分类:
依托单位:清华大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:于戈,郑纬民,舒继武,鲍玉斌,姜进磊,宋杰,林甲灶,陈默,冷芳玲
关键词:
按需定制存储系统高效能大数据动态自调整
结项摘要

With the explosive growth of data size and data complexity, it is no doubt that we are stepping into the "Big Data" era. However, the diversity and continued increment of both data and users' requirements put forward new challenges on the existing data storage and management systems. In order to achieve high efficiency in terms of both hardware utilization at different levels and the number of data.items processed per unit time, this project aims to develop a set of Big Data storage and management technologies, including the way to construct I/O-specific (application customizable) storage systems on-demand, the method to implement dynamic self-tuning of the constructed system, and the mechanism to simultaneously run multiple big data organization and management models on a pool of various.devices. More specifically, the project focuses on three aspects of high-efficient big data storage and management (i.e., architecture, supporting techniques and application verification) and tries to solve such problems as how to construct an application customizable storage system on demand and to tune it dynamically, how to efficiently sense and classify I/O behavior of applications and automatically feed the result back to the storage management system, how to effectively and efficiently manage the storage of various high-concurrent complex data, how to gather and scatter data, how to schedule storage tasks in a storage-compute-transfer-aware way, and how to evaluate a storage system that allows for the simultaneous run of multiple application customizable storage systems. Finally, a system will be developed and evaluated with real data from satellite remote sensing and ocean monitoring.

随着数据规模的爆炸式增长和数据模式的高度复杂化,世界已进入网络化的大数据时代。大数据的多样化与持续快速增长、用户对大数据处理与存储的多种类需求等都对大数据的存储与管理提出了新挑战。本项目开展大数据高效能存储与管理方法研究,提出针对大数据应用I/O特征定制的按需构建机制和可自调整运行优化方法,支持多个大数据组织与管理模式的同时运行机制,实现多层次存储介质硬件部件的整体利用率和单位时间内大数据处理条目数两方面的综合效能提升。项目从大数据高效能存储与管理体系、支撑技术和应用验证三个方面,解决应用定制存储系统的按需定制与动态调整、应用存储特性灵敏感知与自回馈机制、高并发多种类复杂数据存储的效能管理、数据动态聚散机制、存算传融合的存储调度、多应用定制存储系统共存的系统效能评测方法等问题,最后通过卫星遥感大数据流式数据管理和分析、海洋环境监测大数据统计分析等开展应用验证。

项目摘要

本项目针对大数据体量大、复杂度高、变化快等特性所带来的存储挑战,结合内存、相变存储、固态硬盘、磁盘等不同类型存储介质的性能及能耗特征,探索并利用大数据的关联性、异质性、异构性等特征对存储效能的影响模式,围绕大数据高效能存储与管理体系、支撑技术和上层应用三个层次开展大数据高效能存储与管理方法的研究。项目解决了应用定制存储系统的按需定制与动态调整、应用存储特性灵敏感知与自回馈机制、高并发多种类复杂数据存储的效能管理、数据动态聚散机制、存算传融合的存储调度、多应用定制存储系统共存的系统效能评测方法等问题,最后通过卫星遥感大数据流式数据管理和分析、海洋环境监测大数据统计分析等开展应用验证。截止到2018年底,项目组已在项目计划中全部八个研究方向,共23个研究点展开了研究工作,攻克了数十个研究难点,并取得了多项研究成果。.项目主要成果包括在TOC、TPDS等期刊和OSDI、ATC、VLDB等会议上发表论文60篇,其中CCF A类论文共计23篇,SCI检索论文26篇,申请/授权27项发明专利和1项软件著作权。此外,项目组还发表专著3项,开源系统7项。项目组通过积极参与相关领域主流国际会议、邀请国外专家访问等方式,与同行进行了深入的学术交流合作。组织国际学术会议CCGrid一次,组织国际性的大数据存储与管理研讨会4次。本项目共培养了25名研究生,其中19名博士生,6名硕士生。目前16人已毕业,9人在读。.项目组获得国家级奖励1项,省部级奖励3项,还获得IEEE TCSC最佳博士毕业论文1项,CCF优秀博士论文1项,CCF BigData 2017 最佳论文1篇,沈阳市自然科学学术成果一等奖1项。项目组与中国移动、宝钢、国家海洋局等企业展开合作,就各种大数据的存储与管理型应用开展联合研究,项目成果具有重要应用价值,具体包括:卫星遥感大数据流式管理和分析型应用、海洋环境监控大数据在线查询统计分析型应用、中国移动社交网络大数据迭代分析型应用、宝钢过程监控大数据质量控制型应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

武永卫的其他基金

批准号:60773145
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:90412006
批准年份:2004
资助金额:30.00
项目类别:重大研究计划
批准号:61433008
批准年份:2014
资助金额:395.00
项目类别:重点项目
批准号:60373004
批准年份:2003
资助金额:22.00
项目类别:面上项目
批准号:61373145
批准年份:2013
资助金额:78.00
项目类别:面上项目

相似国自然基金

1

大数据高效能存储与管理方法研究

批准号:61433008
批准年份:2014
负责人:武永卫
学科分类:F03
资助金额:395.00
项目类别:重点项目
2

计算与存储融合的实时GIS数据组织管理方法

批准号:41571392
批准年份:2015
负责人:张叶廷
学科分类:D0114
资助金额:60.00
项目类别:面上项目
3

面向大数据保护的高效能重复数据删除存储关键技术研究

批准号:61402518
批准年份:2014
负责人:付印金
学科分类:F0204
资助金额:26.00
项目类别:青年科学基金项目
4

云存储网关协同的高效能分布数据存储基础理论和关键技术研究

批准号:61379146
批准年份:2013
负责人:李姗姗
学科分类:F0207
资助金额:73.00
项目类别:面上项目