面向分布式存储系统的数据快速修复纠删码关键技术研究

基本信息
批准号:61902422
项目类别:青年科学基金项目
资助金额:26.00
负责人:柳青
学科分类:
依托单位:中国人民解放军海军工程大学
批准年份:2019
结题年份:2021
起止时间:2020-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:
关键词:
修复带宽数据重建分布式存储系统存储系统可靠性纠删码
结项摘要

In distributed storage systems, the erasure code ensures the reliability of the data with high storage efficiency and reduces the risk of data loss. The process of rebuilding the failed data is called data repair. The traditional erasure codes take up a lot of computing resources, network bandwidth and disk I/O in the data repair process. The fast-data-repair erasure codes can significantly reduce the repair cost, but they have some limits: only applicable for some specific coding parameters, sacrificing the fault tolerance, or only applicable for specific finite fields. To address above problems, the project will study the coding extension technology of fast-data-repair erasure codes from the following aspects: First, we study a class of extension method for coding parameters, applicable to all kinds of erasure codes, which can make the erasure codes suitable for general distributed storage systems, and maintain the fast repair ability. Second, we study some fast-data-repair erasure codes over specific Galois field, and measure their failure tolerance in the extended composite Galois field. At last, based on two above extension methods, we utilize the evolutionary algorithm and artificial neural network method to find erasure codes with high failure tolerance and fast repair ability, from the code-extended code set of above two processes.The results of this project will help to reduce the data repair cost and enhance the data reliability in distributed storage systems, while promoting the application of artificial intelligence technologies in the field of erasure code construction at the same time.

在分布式存储系统中,纠删码以较高的存储效率保证了数据的可靠性,降低了数据丢失风险。对失效数据进行重建的过程叫做数据修复,传统纠删码在数据修复过程中占用大量计算资源、网络带宽和磁盘I/O。数据快速修复纠删码能够显著降低数据修复开销,但现有该类编码存在局限性:编码方法仅适用于特定参数,牺牲容错能力,编码方法基于特定有限域等。针对以上问题,本项目将从以下几个方面研究这类纠删码的编码扩展技术:首先,研究适用于一般纠删码的编码参数扩展方法,使得其适用于通用的分布式存储系统,并保持原有的数据快速修复能力;其次,针对特定有限域上具有最优数据修复性质的纠删码,研究其在扩展后的复合域上的容错能力;最后,在经过编码扩展后的纠删码集合中,运用演化算法和神经网络筛选出具有高容错、高修复能力的编码方法。本项目成果将有助于减小存储系统的数据重建效率,提高系统可靠性,并有助于推动人工智能技术在纠删码编码构造上的应用。

项目摘要

纠删码因为其良好的容错性质和存储效率被广泛地运行在分布式存储系统中,但它也存在着修复开销大的问题。近年来,针对减少单节点修复开销的新型纠删码被不断提出,但这些编码方法的构造或基于特定方法,或仅适用于特定参数。总结新型纠删码减少修复开销的规律,提出构建通用编码方法对提高数据可靠性和推广减少修复开销编码方法的适用性具有重要意义,同样也能产生重大经济效益。..本项目研究在二元域GF(2)上分析了生成矩阵的最优容错性质和修复性质,提出一种在判定生成矩阵最优容错的简单判据,同时也提出了一种判断减少修复开销的快速验证方法,该方法保证生成矩阵扩展至一般有限域也维持了其修复开销。分别基于有限域GF(2^w)和二元域GF(2),我们开发了rlclib编码库和brmlib编码库,并结合已有的减少修复开销的编码方法,验证了我们关于生成矩阵容错性质和修复性质的分析。我们还提出一种结合多核CPU和FPGA的异构并行计算框架,加速筛选生成矩阵和计算其修复开销的过程。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
3

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
4

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020
5

污染土壤高压旋喷修复药剂迁移透明土试验及数值模拟

污染土壤高压旋喷修复药剂迁移透明土试验及数值模拟

DOI:10.11908/j.issn.0253-374x.19265
发表时间:2020

柳青的其他基金

批准号:31801018
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:30271368
批准年份:2002
资助金额:20.00
项目类别:面上项目
批准号:81170189
批准年份:2011
资助金额:50.00
项目类别:面上项目
批准号:81100969
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:U1633123
批准年份:2016
资助金额:28.00
项目类别:联合基金项目
批准号:31400351
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

面向纠删码云存储系统的数据快速重构技术研究

批准号:61702013
批准年份:2017
负责人:傅颖勋
学科分类:F0204
资助金额:24.00
项目类别:青年科学基金项目
2

分布式存储系统基于纠删码的可靠访问关键技术研究

批准号:61602120
批准年份:2016
负责人:沈志荣
学科分类:F0204
资助金额:21.00
项目类别:青年科学基金项目
3

面向大数据存储的节省带宽修复的纠删码技术研究

批准号:61662038
批准年份:2016
负责人:殷超
学科分类:F0204
资助金额:29.00
项目类别:地区科学基金项目
4

基于纠删码的异构分布式内存键值存储系统构建及性能优化

批准号:61872130
批准年份:2018
负责人:胡玉鹏
学科分类:F0207
资助金额:64.00
项目类别:面上项目