Some high energy physics experiments like BESIII and Dayabay are running, and some more large experiments like Jiangmen neutrino (JUNO) and Large High Altitude Air Shower Observatory (LHAASO) are under construction, and the planning China Circular Electron Positron Collider (CEPC) as well. These experiments will produce more times of data as today, and bring unprecedented challenges to offline data storage technology. Current existing storage systems, metadata is managed statically, which leads to performance bottleneck; Metadata and file operations are tightly coupled, and it is difficult to scale for a closed system; Local data and remote data are managed separately; Traditional RAID technology cause too much time consumption for data recovery and system crash in case of host failure. These questions have already caused the rise of the storage system failure, and must be solved as soon possible. Then, this project proposes an innovative design idea of building a third-party loosely-coupled good-scalability storage middleware, make metadata management and file operations separated; proposes horizontal, longitudinal, and cross-site integration solution of storage system to implement the uniform storage management across different sites around the world; Accurately analyze data I/O pattern based on deep neural network, and design networked data redundancy and hierarchical storage management. The project will improve the performance and reliability significantly of offline data storage system, which helps high energy physics research to achieve high level results faster and earlier.
北京谱仪和大亚湾中微子等高能物理实验正在运行,江门中微子、高海拔宇宙线观测站等更大规模的实验正在建设,还有规划中的环形正负电子对撞机,将产生数倍于现在的数据,给离线数据存储技术带来前所未有的挑战。现有存储系统,元数据 “静态”管理,存在性能瓶颈;元数据与文件操作紧密耦合,难以扩展;本地数据与远程数据管理割裂;传统RAID技术数据恢复时间长,不能屏蔽主机错误等等。这些问题已经导致现有存储系统故障率上升,必须尽快解决。为此,本项目提出第三方松耦合可扩展存储中间件的创新设计思想,将元数据管理功能与文件操作功能分离;提出存储系统横向、纵向以及跨站点的整合方案,实现跨地域多站点之间的统一存储;采用深度神经网络精确分析数据I/O访问模式,并实现基于网络的数据冗余和分层存储等功能。本项目将大幅提高存储系统的性能和可用性,为我国高能物理研究早出快出高质量的成果奠定坚实的基础。
目前,北京谱仪、大亚湾中微子、江门中微子、高海拔宇宙线观测站等高能物理实验,每年将产生数以PB级的实验数据,并进行全球分布式数据处理,这给离线数据存储系统带来前所未有的挑战。针对这些需求,本项目对大规模离线数据存储若干关键技术展开研究,主要研究内容及成果包括:1)研究了基于内存数据库实现元数据管理的关键技术,并采用内存数据库集群Ramcloud实现了原型系统,验证了该方案的可行性,并开始在部署和应用示范;2)采用基于深度神经网络的监督学习方法来精确分析高能物理数据I/O访问模式,并采用强化深度学习实现了Lustre存储系统的自动调参,为面向应用的细粒度存储优化奠定了技术基础;3)针对高延迟网络条件下远程文件系统I/O效率低下的问题,将远程数据访问I/O操作转换成多流、分块、并行的数据传输,并采用本地缓存技术。原型系统测试证明该方法能有效加速远程文件首次访问及后续访问的性能,可以很好地适应未来的高能物理计算模式;4)采用磁盘扩展柜JBOD代替传统RAID阵列的硬件架构,研究基于纠删码的软件冗余技术,并在我国高能物理领域首次部署,可大幅提高数据可靠性与数据访问性能,这将成为未来高能物理实验离线数据存储系统的主要模式;5)提出在数据写入时对文件进行分类存储的方案,并采用基于决策树的随机森林对文件访问场景进行识别;同时,基于LSTM长短期记忆神经网络算法预测文件热度。这两种方法的准确率均能够达到80%以上,这为未来分层存储的实施奠定了技术基础。.本项目在启动之初就与高海拔宇宙线观测站(LHAASO)等高能物理实验建立了密切的联系,注重解决大科学工程中的实际技术问题,具有非常高的实际应用价值。目前最新的研究成果已经在LHAASO中部署和使用,下一步将推广到江门中微子实验等国家重大科技基础设施项目中,为国家重大需求服务。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
虚拟化平台上的高能物理离线数据处理技术研究
高能物理离线数据处理虚拟计算资源管理技术研究
高能物理实验离线软件中探测器建模新技术的研究
大规模模糊RDF数据存储与查询关键技术研究