面向大规模分布式存储系统中冗余编码的性能优化研究

基本信息

批准号：61571136

项目类别：面上项目

资助金额：63.00

负责人：王新

学科分类：

依托单位：复旦大学

批准年份：2015

结题年份：2019

起止时间：2016-01-01 - 2019-12-31

项目状态：已结题

项目参与者：赵泽宇,宫庆媛,沈佳杰,卫东升,李颂,张旭,魏学才,齐凤林

关键词：

节点选择数据更新数据修复冗余编码分布式存储

结项摘要

Large-scale distributed storage systems, store a substantial amount of data in a large number of low-cost storage nodes, maintaining the integrity of data by storing redundancy, which become key support on Internet and DCN applications. To compensate for potential losses of data, the amount of redundancy should be maintained such that when a node fails, the corresponding amount of redundancy should be regenerated. Large-scale distributed storage systems, generally, are featured by heterogeneous computing, storage and bandwidth. Existing works commit to reduce the regeneration time by either minimizing the regenerating traffic, or adjusting the regenerating traffic patterns, whereas nodes participating the regeneration are generally assumed to be given beforehand. However, real-world distributed storage systems usually exhibit heterogeneous link capacities, and the regeneration time is highly related to the selection of the participating nodes. Data update makes big challenges under coding mechanisms, since it will cause more computation and transmission, in comparison with duplication methods. In this project, we will study the selection of storage nodes, provider nodes, newcomer nodes and even their joint selection. Based on this, we will propose corresponding coding algorithms and regenerating methods. Moreover, we will study and present the optimization of bandwidth and I/O operation when coding and update coexist.

项目摘要

大规模分布式存储系统，通过网络将大量低成本存储节点连接起来，提供可靠的数据访问服务，是互联网应用、数据中心服务的重要支撑技术。在实际系统中，针对因存储节点失效造成的数据不可访问甚至数据永久丢失，数据冗余修复技术发挥着重要作用。大规模分布式存储系统，一般具有节点计算、存储、带宽等异构性，因（使用的）节点不同会造成编码开销、修复开销的显著差异；因原始数据更新，每一个存储节点上的数据也需要相应更新，与副本方式相比，编码方式数据更新更复杂、更具挑战性。本课题将对上述因大规模和冗余编码带来的性能问题开展研究，针对大规模分布式存储系统中的节点选择机制，研究并提出异构环境下的存储节点选择策略、供应节点选择策略、新生节点选择策略及联合选择策略；在此基础上研究并提出数据再生编码方案和修复方案；针对因数据更新造成的编码数据更新，研究适合编码操作的数据更新策略，优化编码数据更新中的网络带宽和磁盘I/O开销。.在测试和分析现有编码方案和测试分布式存储系统的性能基础上，本项目确定了数据读写、更新和修复操作成为当前编码分布式存储系统性能瓶颈的原因。通过理论分析编解码过程，本项目研究了编码情况下不同操作性能编码上界。本项目引入异构网络/节点协作传输、流水线资源调度及编码计算序列调度等性能方案，并提出了性能优化方案提升分布式存储系统数据读写、更新和修复操作的性能。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2018

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：

发表时间：2021

DOI：10.11936/bjutxb2021010011

发表时间：2021

DOI：10.11707/j.1001-7488.20210410

发表时间：2021

王新的其他基金

批准号：71102181

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：30371762

批准年份：2003

资助金额：20.00

项目类别：面上项目

批准号：51779151

批准年份：2017

资助金额：61.00

项目类别：面上项目

批准号：41874199

批准年份：2018

资助金额：65.00

项目类别：面上项目

批准号：31871894

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：81900410

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

批准号：11004016

批准年份：2010

资助金额：22.00

项目类别：青年科学基金项目

批准号：11102120

批准年份：2011

资助金额：28.00

项目类别：青年科学基金项目

批准号：39770771

批准年份：1997

资助金额：10.00

项目类别：面上项目

批准号：10804082

批准年份：2008

资助金额：24.00

项目类别：青年科学基金项目

批准号：41504130

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：30672399

批准年份：2006

资助金额：29.00

项目类别：面上项目

批准号：81673038

批准年份：2016

资助金额：56.00

项目类别：面上项目

批准号：11774384

批准年份：2017

资助金额：65.00

项目类别：面上项目

批准号：81272650

批准年份：2012

资助金额：70.00

项目类别：面上项目

批准号：11174324

批准年份：2011

资助金额：68.00

项目类别：面上项目

批准号：51109143

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：41105029

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：41704115

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：30973410

批准年份：2009

资助金额：32.00

项目类别：面上项目

批准号：51479124

批准年份：2014

资助金额：84.00

项目类别：面上项目

批准号：11105098

批准年份：2011

资助金额：30.00

项目类别：青年科学基金项目

批准号：51602111

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：60702054

批准年份：2007

资助金额：21.00

项目类别：青年科学基金项目

批准号：61171074

批准年份：2011

资助金额：56.00

项目类别：面上项目

批准号：60176033

批准年份：2001

资助金额：5.00

项目类别：面上项目

批准号：31400918

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：11874091

批准年份：2018

资助金额：64.00

项目类别：面上项目

批准号：81903212

批准年份：2019

资助金额：20.00

项目类别：青年科学基金项目

批准号：39970901

批准年份：1999

资助金额：13.00

项目类别：面上项目

批准号：11601279

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：31271858

批准年份：2012

资助金额：81.00

项目类别：面上项目

批准号：81903398

批准年份：2019

资助金额：20.00

项目类别：青年科学基金项目

批准号：51405492

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

相似国自然基金

面向大数据应用的分布式海量存储系统性能优化关键技术研究

批准号：61873160

批准年份：2018

负责人：韩德志

学科分类：F0303

资助金额：63.00

项目类别：面上项目

面向大规模优化问题的分布式Memetic算法研究

批准号：61502544

批准年份：2015

负责人：余维杰

学科分类：F0201

资助金额：22.00

项目类别：青年科学基金项目

面向闪存固态盘冗余阵列存储系统的关键技术研究

批准号：61902218

批准年份：2019

负责人：申兆岩

学科分类：F0204

资助金额：27.00

项目类别：青年科学基金项目

分布式存储系统中数据再生的磁盘读写开销优化研究

批准号：61402172

批准年份：2014

负责人：王艳

学科分类：F0204

资助金额：20.00

项目类别：青年科学基金项目

面向大规模分布式存储系统中冗余编码的性能优化研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

神经退行性疾病发病机制的研究进展

智能煤矿建设路线与工程实践

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

城市生活垃圾热值的特征变量选择方法及预测建模

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

王新的其他基金

经理人权力特征、薪酬激励与企业业绩

介导巴豆油促胃肠动力作用靶蛋白分子的鉴定及功能研究

窄缝射流空化诱发止水强烈自激振动机理及防治技术研究

太阳风湍流离子尺度上的谱拐点及湍流耗散机制的观测研究

新的金黄色葡萄球菌肠毒素SEE2的特性及其介导ST6型菌株食物中毒机制研究

Ninj1通过调控单核/巨噬细胞迁移和炎性活化促进腹主动脉瘤形成的实验研究

用于紫外光探测器的NiO基薄膜制备和性质研究

自由式滑雪空中技巧项目人体调控对出台速度影响的研究

子宫内膜异位症与人类白细胞抗原相关性的研究

纳米金壳复合发光材料在表面等离子体场中的光学性质及其生物效应研究

太阳风湍流在二维波矢空间分布特征的观测研究

结肠癌新抗原MC3-Ag、MC5-Ag的分离、鉴定和功能分析

EB病毒相关胃癌体内外模型的建立及其在靶向药物联合免疫细胞治疗策略中的应用

新型稀土氟化物/Cu2-xS的MR-NIR(Ⅱ)荧光-光声多模态纳米探针构建及其活体成像和光热治疗研究

MC3-Ag/Txl-2与小G蛋白家族分子Ran相互作用介导结肠癌转移的机制研究

以NaGdF4为骨架纳米药物载体的构建以及用于肿瘤诊断和治疗的研究

波流联合作用下风机支撑结构的流固耦合振动研究

基于多源卫星数据的热带气旋强度与其内部中尺度对流的相互作用机制研究

基于深度学习的采区构造煤分布动态预测模型研究

胃癌相关新抗原MGb2Ag/Trak1促进胃癌增殖和转移的分子机制

高速水流冲磨与空蚀耦合作用下过流壁面蚀损机理研究

高分辨率X射线非球面KB显微镜研究

基于内建电场三维硅纳米结构的α相三氧化二铁制备及其光催化性能的研究

具有网络编码功能的新型路由器结构与路由技术研究

分布式存储系统中高时效性的数据缓存和修复策略研究

超大规模集成电路铜布线化学机械抛光材料研究

insm1a在成年斑马鱼自发性脊髓再生过程中的功能研究

防离子反馈膜对像增强器光场和带电粒子传输特性的影响

消退素RvD1通过METTL3介导m6A修饰调控银屑病炎症过程的机制研究

胃肠道内介导巴豆和番泻叶作用的生物分子的筛选及鉴定

高亏格Gromov-Witten不变量和Virasoro猜想

QS分子对食源性金黄色葡萄球菌肠毒素及生物被膜形成中的作用研究

胆结石与2-型糖尿病双向因果关联推断的两样本孟德尔随机化研究

基于车体姿态预估的果园作业车主动安全控制方法研究

相似国自然基金