面向E级计算的纠删码机群文件系统研究

基本信息
批准号:61502454
项目类别:青年科学基金项目
资助金额:20.00
负责人:邢晶
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:魏征,刘宏博,郑华杰,苏鹏飞,付新
关键词:
E级计算机群文件系统纠删码
结项摘要

With the rapid development of information technology, Exascale supercomputer will be developed in recent years. The storage system of supercomputer need to address challenges at reliability and scalability. Cluster file system need to provide high reliable data storage and high I/O bandwidth. Adopting erasure code to provide fault tolerance service can achieve high utilization of data storage, which can reduce the cost to maintain mass data storage. However, when data is encoding or decoding, the overhead of computing and I/O is too high to apply erasure code to high performance computing. To improve the performance of data encoding and decoding in erasure coded cluster file system, this project will do research on reducing the overhead of data decoding, optimizing data encoding based on CPU SIMD Instruction set and improving the performance of data updating. To evaluate this project, we will implement the new erasure code algorithm in a cluster file system. Then data I/O and data reliability experiment of the cluster file system will be designed to evaluate our research.

随着E级超级计算机的到来,高性能计算机的存储系统在可靠性和可扩展性等方面面临巨大的挑战。机群文件系统在提供高可靠的数据存储的同时还需提高数据的读写性能。采用纠删码的数据容错方法具备高效的存储空间利用率,能够有效降低海量数据存储的维护成本。然而数据在编码和解码过程的高计算开销和高磁盘访问开销限制了纠删码技术在高性能计算领域的运用。为了提高基于纠删码的机群文件系统的数据读写性能,本项目将在降低纠删码存储的恢复开销、优化基于处理器SIMD指集令的数据编码方法以及降低数据更新等方面进行深入研究。为评价本项目研究工作的价值,我们会将研究结果实现于纠删码机群文件系统上,并通过测试机群文件系统在数据存储和数据恢复等方面的性能作为评价该项目研究价值的重要依据。

项目摘要

随着E级超级计算机的到来,高性能计算机的存储系统在可靠性和可扩展性等方面面临巨大的挑战。机群文件系统在提供高可靠的数据存储的同时还需提高数据的读写性能。采用纠删码的数据容错方法具备高效的存储空间利用率,能够有效降低海量数据存储的维护成本。然而数据在编码和解码过程的高计算开销和高磁盘访问开销限制了纠删码技术在高性能计算领域的运用。为了提高基于纠删码的机群文件系统的数据读写性能,本项目在降低纠删码存储的编码开销、降低数据更新开销和提高数据恢复效率等方面进行了深入研究。在降低纠删码编码开销方面,我们提出了一种低延迟并发编码实现机制。该方法并行数据编码和数据传输的流程,以降低机群文件系统中数据写入过程的编码开销。在降低纠删码更新效率方面,我们提出了一种基于副本日志的更新方法。它以日志形式对数据和校验数据进行记录,并维护多份副本。该方法可以合并重复更新请求,并将连续更新请求进行聚合。此外,副本机制可以保证数据的一致性,并使数据更新效率接近副本更新。在提高纠删码恢复效率方面,我们提出了一种结合数据放置和数据调度的数据恢复方法。该方法在数据写入系统中就依据数据恢复路径进行数据放置,并在数据恢复期间,通过衡量不同恢复路径的开销,选择最短的恢复路径,从而提高数据恢复效率。为评价本项目研究工作的价值,我们将研究结果实现于自研发的纠删码机群文件系统上。测试表明,在降低纠删码编码开销方面,我们能将编码效率提高20%以上;在降低纠删码更新开销方面,我们达到副本维护方式的更新效率;在降低纠删码恢复开销方面,我们提高了磁盘恢复过程的聚合IO带宽,能够以80%以上的磁盘利用率进行磁盘重建。研究结果表明了我们的工作能够在多个方面降低纠删码存储开销,使得纠删码存储在提供高效率存储的同时提供高性能的IO服务,满足了高性能计算应用以及其他大数据应用对存储系统的需求。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
2

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020
3

计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型

计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型

DOI:10.19595/j.cnki.1000-6753.tces.151503
发表时间:2017
4

In situ construction of hybrid Co(OH)2 nanowires for promoting long-term water splitting

In situ construction of hybrid Co(OH)2 nanowires for promoting long-term water splitting

DOI:10.1016/j.apcatb.2021.120063
发表时间:2021
5

金属锆织构的标准极图计算及分析

金属锆织构的标准极图计算及分析

DOI:10.16112/j.cnki.53-1223/n.2019.02.003
发表时间:2019

邢晶的其他基金

相似国自然基金

1

云存储中的协同纠删码技术

批准号:61572181
批准年份:2015
负责人:胡玉鹏
学科分类:F0207
资助金额:67.00
项目类别:面上项目
2

面向大数据存储的节省带宽修复的纠删码技术研究

批准号:61662038
批准年份:2016
负责人:殷超
学科分类:F0204
资助金额:29.00
项目类别:地区科学基金项目
3

面向纠删码云存储系统的数据快速重构技术研究

批准号:61702013
批准年份:2017
负责人:傅颖勋
学科分类:F0204
资助金额:24.00
项目类别:青年科学基金项目
4

高容错能力的阵列纠删码模型研究

批准号:61501064
批准年份:2015
负责人:唐聃
学科分类:F0102
资助金额:21.00
项目类别:青年科学基金项目