With the development of network and information technology, the dependency of network storage system is bigger and bigger for government or institution. As the explosive growth of data and gradual enlargement of storage node scale, the access of massive data propose the demands of reliability and availability for storage systems, and the complexity of workload characteristics and application scenarios raise the adaptive challenges for storage systems. As flexible data layout mechanisms, erasure codes insure storage reliability and data available. The project plan to research fault-tolerant mechanisms and recovery methods when disk failures in large-scale erasure-coded storage systems, specifically, take full advantage of considering the numerous, failure usualness and heterogeneous characteristics of storage nodes, and the spatiotemporal characteristic of data access, and incorporating the complexity of workload characteristics and application scenarios. Around the research of the key technologies in data layout and I/O scheduling, designing and implementing an erasure-coded storage cluster systems with high reliability and high I/O performance in large-scale storage systems. Research contents include developing a new coupling erasure code with high reliability and high recovery performance; service-oriented elastic I/O schedule methods for data recovery, heterogeneous hybrid storage architecture with ubiquitous service. The research has positive effect on the fault-tolerant technologies of large-scale storage systems and talent training in Qinghai-Xizang region.
随着网络及信息技术发展,企业/机构对网络存储系统的依赖性越来越大,正面临数据爆炸式增长与存储规模不断扩大需求,因此对存储系统提出高可靠性与可用性要求,同时负载特征与应用环境复杂性对存储提出适应性挑战。由于灵活数据布局机制,纠删编码可用于保障存储可靠性与数据可用性。本项目拟研究基于纠删编码的大规模存储集群系统数据容错机制以及故障发生时的数据修复机制,具体地,充分考虑存储节点众多、失效经常性、异构特征、以及数据存取具有时间空间特性,结合负载特征复杂性与应用环境复杂性等特点,以数据布局和数据调度研究为主线,设计并实现一个支持高可靠性与高I/O性能的基于纠删编码的大规模存储集群系统。研究内容包括:支持高可靠性与高重构性能的新型耦合Non-MDS纠删编码布局,面向服务的弹性重构I/O调度算法,支持泛在服务的异构融合存储架构。本研究将对大规模纠删编码容错存储技术及青藏地区信息人才培养起到积极推动作用。
项目背景及内容:现代数据中心面临海量数据存储的需求,纠删编码技术可以确保存储可靠性和数据可用性,因此基于纠删编码技术的存储系统容错及修复问题已成为学术界和工业界研究的热点。本项目主要围绕纠删编码存储集群容错编码布局、节点失效修复机制和异构融合体系架构三个方面开展研究。具体研究:(1)支持高可靠和快速重构的容错编码布局;(2)面向服务的存储集群高效重构I/O调度及迁移策略;(3)面向新型存储器件的异构融合存储系统。. 重要结果、关键数据及其科学意义:针对高容错编码布局问题,提出了一种新型支持负载均衡和高I/O性能的RAID6阵列编码,该编码利用横斜校验分散布局策略提升了现有阵列编码32%-66%的部分条带写性能和32%-53%的降级读性能。面向异构并行存储系统单盘失效问题,提出了一种基于负载感知的高效重构调度策略SmartRec以及动态恢复模型,提升了平均25.8%的磁盘失效恢复性能。面向异构融合存储体系,提出了支持RDMA的纠删编码内存集群快速写策略F-Write,该策略能显著提升纠删编码内存集群系统2.6倍吞吐率,以及61%的写延迟。此外,面向纠删编码存储集群海量数据存储扩容需求,本项目还提出了一类基于RAID编码的数据重组织布局及迁移调度策略,显著减少了数据迁移量并提升了用户响应时间;提出了双容错节点布局的Markov可靠性模型;提出了基于LSM-tree键值存储系统I/O优化调度机制;提出了一种基于延迟的高精度刷新方案提升闪存系统I/O性能。通过本项目建设最终提供了一个高可靠性与高I/O性能的基于纠删编码的存储集群系统。本研究成果对大规模纠删编码存储集群系统容错及修复技术的发展,以及青藏高原地区信息技术人才培养起到了积极推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
基于多模态信息特征融合的犯罪预测算法研究
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
面向对象的集群存储
面向集群式内存的容错机制和数据组织策略研究
基于网络编码的分布式存储容错机制研究
容错存储系统的扩容问题研究