面向大规模分布式存储系统中冗余编码的性能优化研究

基本信息
批准号:61571136
项目类别:面上项目
资助金额:63.00
负责人:王新
学科分类:
依托单位:复旦大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:赵泽宇,宫庆媛,沈佳杰,卫东升,李颂,张旭,魏学才,齐凤林
关键词:
节点选择数据更新数据修复冗余编码分布式存储
结项摘要

Large-scale distributed storage systems, store a substantial amount of data in a large number of low-cost storage nodes, maintaining the integrity of data by storing redundancy, which become key support on Internet and DCN applications. To compensate for potential losses of data, the amount of redundancy should be maintained such that when a node fails, the corresponding amount of redundancy should be regenerated. Large-scale distributed storage systems, generally, are featured by heterogeneous computing, storage and bandwidth. Existing works commit to reduce the regeneration time by either minimizing the regenerating traffic, or adjusting the regenerating traffic patterns, whereas nodes participating the regeneration are generally assumed to be given beforehand. However, real-world distributed storage systems usually exhibit heterogeneous link capacities, and the regeneration time is highly related to the selection of the participating nodes. Data update makes big challenges under coding mechanisms, since it will cause more computation and transmission, in comparison with duplication methods. In this project, we will study the selection of storage nodes, provider nodes, newcomer nodes and even their joint selection. Based on this, we will propose corresponding coding algorithms and regenerating methods. Moreover, we will study and present the optimization of bandwidth and I/O operation when coding and update coexist.

大规模分布式存储系统,通过网络将大量低成本存储节点连接起来,提供可靠的数据访问服务,是互联网应用、数据中心服务的重要支撑技术。在实际系统中,针对因存储节点失效造成的数据不可访问甚至数据永久丢失,数据冗余修复技术发挥着重要作用。大规模分布式存储系统,一般具有节点计算、存储、带宽等异构性,因(使用的)节点不同会造成编码开销、修复开销的显著差异;因原始数据更新,每一个存储节点上的数据也需要相应更新,与副本方式相比,编码方式时数据更新更复杂、更具挑战性。本课题将对上述因大规模和冗余编码带来的性能问题开展研究,针对大规模分布式存储系统中的节点选择机制,研究并提出异构环境下的存储节点选择策略、供应节点选择策略、新生节点选择策略及联合选择策略;在此基础上研究并提出数据再生编码方案和修复方案;针对因数据更新造成的编码数据更新,研究适合编码操作的数据更新策略,优化编码数据更新中的网络带宽和磁盘I/O开销。

项目摘要

大规模分布式存储系统,通过网络将大量低成本存储节点连接起来,提供可靠的数据访问服务,是互联网应用、数据中心服务的重要支撑技术。在实际系统中,针对因存储节点失效造成的数据不可访问甚至数据永久丢失,数据冗余修复技术发挥着重要作用。大规模分布式存储系统,一般具有节点计算、存储、带宽等异构性,因(使用的)节点不同会造成编码开销、修复开销的显著差异;因原始数据更新,每一个存储节点上的数据也需要相应更新,与副本方式相比,编码方式数据更新更复杂、更具挑战性。本课题将对上述因大规模和冗余编码带来的性能问题开展研究,针对大规模分布式存储系统中的节点选择机制,研究并提出异构环境下的存储节点选择策略、供应节点选择策略、新生节点选择策略及联合选择策略;在此基础上研究并提出数据再生编码方案和修复方案;针对因数据更新造成的编码数据更新,研究适合编码操作的数据更新策略,优化编码数据更新中的网络带宽和磁盘I/O开销。.在测试和分析现有编码方案和测试分布式存储系统的性能基础上,本项目确定了数据读写、更新和修复操作成为当前编码分布式存储系统性能瓶颈的原因。通过理论分析编解码过程,本项目研究了编码情况下不同操作性能编码上界。本项目引入异构网络/节点协作传输、流水线资源调度及编码计算序列调度等性能方案,并提出了性能优化方案提升分布式存储系统数据读写、更新和修复操作的性能。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

王新的其他基金

批准号:30371762
批准年份:2003
资助金额:20.00
项目类别:面上项目
批准号:71102181
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:51779151
批准年份:2017
资助金额:61.00
项目类别:面上项目
批准号:41874199
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:31871894
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:81900410
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:11004016
批准年份:2010
资助金额:22.00
项目类别:青年科学基金项目
批准号:11102120
批准年份:2011
资助金额:28.00
项目类别:青年科学基金项目
批准号:39770771
批准年份:1997
资助金额:10.00
项目类别:面上项目
批准号:10804082
批准年份:2008
资助金额:24.00
项目类别:青年科学基金项目
批准号:41504130
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:30672399
批准年份:2006
资助金额:29.00
项目类别:面上项目
批准号:81673038
批准年份:2016
资助金额:56.00
项目类别:面上项目
批准号:11774384
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:81272650
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:11174324
批准年份:2011
资助金额:68.00
项目类别:面上项目
批准号:51109143
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:41105029
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:41704115
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:30973410
批准年份:2009
资助金额:32.00
项目类别:面上项目
批准号:51479124
批准年份:2014
资助金额:84.00
项目类别:面上项目
批准号:11105098
批准年份:2011
资助金额:30.00
项目类别:青年科学基金项目
批准号:51602111
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:60702054
批准年份:2007
资助金额:21.00
项目类别:青年科学基金项目
批准号:61171074
批准年份:2011
资助金额:56.00
项目类别:面上项目
批准号:60176033
批准年份:2001
资助金额:5.00
项目类别:面上项目
批准号:31400918
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:11874091
批准年份:2018
资助金额:64.00
项目类别:面上项目
批准号:81903212
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目
批准号:39970901
批准年份:1999
资助金额:13.00
项目类别:面上项目
批准号:11601279
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:31271858
批准年份:2012
资助金额:81.00
项目类别:面上项目
批准号:81903398
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目
批准号:51405492
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

面向大数据应用的分布式海量存储系统性能优化关键技术研究

批准号:61873160
批准年份:2018
负责人:韩德志
学科分类:F0303
资助金额:63.00
项目类别:面上项目
2

面向大规模优化问题的分布式Memetic算法研究

批准号:61502544
批准年份:2015
负责人:余维杰
学科分类:F0201
资助金额:22.00
项目类别:青年科学基金项目
3

面向闪存固态盘冗余阵列存储系统的关键技术研究

批准号:61902218
批准年份:2019
负责人:申兆岩
学科分类:F0204
资助金额:27.00
项目类别:青年科学基金项目
4

分布式存储系统中数据再生的磁盘读写开销优化研究

批准号:61402172
批准年份:2014
负责人:王艳
学科分类:F0204
资助金额:20.00
项目类别:青年科学基金项目