基于NoSQL集群数据库的下一代托卡马克实验数据存储技术研究

基本信息

批准号：11605068

项目类别：青年科学基金项目

资助金额：22.00

负责人：郑玮

学科分类：

依托单位：华中科技大学

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：丁同海,马少翔,柳强,胡斐然,万宽红,李阳

关键词：

NoSQL数据存储计算机集群存储托卡马克数据采集

结项摘要

As the tokamak discharge goes towards long pulse and faster digitizers are used in more sophisticated diagnostics, the scientific data generated during the experiment pulse is getting extremely larger. The future tokamaks like ITER and CFETR will produce hundreds times of data than today’s major tokamaks. Through their life, the demands will keep growing. Current available technologies in fusion community are hard to scale and cannot handle big data efficiently, they may barely meet the requirement of future tokamaks. This project attempts to find a solution for large tokamak scientific data archiving by using NoSQL cluster database technology. It will provide a storage and management system that can out performance the current available solutions and easily scale-out its capability, performance at low cost, but relies on no specific hardware technology. This technology will satisfy the continuously growing need for large scientific data storage of the future tokamaks and provide a good reference for future tokamak scientific data storage development.

随着托卡马克实验向长脉冲发展和高速、高精度的数据采集的应用，托卡马克实验产生的数据量也在高速增长，ITER、CFETR等未来托卡马克装置产生的数据量将是目前装置的上百倍，且会随着装置的发展和持续运行不断增长。这对目前聚变领域现有的存储技术在高性能、高扩展性、高可靠性等方面提出了严峻的挑战，因此非常有必要对托卡马克实验数据存储技术进行前瞻性探索研究。本项目将探索利用新兴的NoSQL集群数据库技术，研究并实现一种容量与性能可方便地横向扩展，具有高并发性能、高可靠性的下一代托卡马克实验数据存储技术。所研究的数据存储技术不依赖任何特定的存储硬件，可大大降低实现成本。本项目有望给出基于NoSQL集群数据库的下一代托卡马克实验数据存储技术方案，为ITER、CFETR等未来托卡马克数据存储系统的研制提供重要参考。

项目摘要

托卡马克实验数据存储系统存储来自诊断系统的所有科学数据，并提供管理、检索、访问这些数据的方法以实现实验数据分析，是托卡马克实验研究开展必需的系统。随着托卡马克实验向稳态长脉冲发展，以及诊断技术的发展，托卡马克实验产生的科学数据急剧增长。未来托卡马克装置数据存储系统必须具有更高的性能和容量，还需要在不影响实验的情况下方便地对系统的容量和读写性能进行扩展。目前主流的并行文件系统如GlusterFS、Lustre等技术本质上是由Object Storage集群实现，上层封装兼容POSIX文件系统API，对于聚变实验数据这种自身非结构化的数据来说存在额外性能开销。.本项目研究中成功的使用MongoDB与Cassandra NoSQL集群数据库分别实现了两种用于聚变实验存储的系统，在不实现POSIX文件系统API的情况下实现对聚变装置实验数据的存储服务。通过研究和优化测试，我们采用Cassandra集群数据库设计了优化的负载平衡策略，实现聚变实验数据的存储引擎，采用MongoDB实现了结构化的实验数据Metadata存储，并设计了一整套聚变实验数据存储系统原型。.该项目中研发的J-TEXT Cloud Database（JCDB）存储系统集群在数据量增加并且获得了接近线性的增加节点性能提升，在应用于聚变实验诊断数据存储时，性能超过主流的GlusterFS，与ITER计划采用方案BeeGFS与HDF5文件格式性能相当。在此研究成果上，我们实现了J-TEXT破裂数据库系统，实现高效的破裂相关诊断实验数据的存储与检索，为破裂预测研究提供了支持。本项目证明了NoSQL用于聚变实验数据存储的可能性，给出了其实现方案，与现有先进技术进行了对比，为未来聚变装置实验数据存储提供了参考和候选方案。.

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2016

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.11707/j.1001-7488.20210410

发表时间：2021

DOI：

发表时间：2017

DOI：

发表时间：2021

郑玮的其他基金

批准号：81471112

批准年份：2014

资助金额：70.00

项目类别：面上项目

批准号：71902029

批准年份：2019

资助金额：18.00

项目类别：青年科学基金项目

批准号：31201087

批准年份：2012

资助金额：21.00

项目类别：青年科学基金项目

批准号：81000468

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：21601060

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：81902214

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

相似国自然基金

托卡马克自举电流成分的实验研究

批准号：11075092

批准年份：2010

负责人：王文浩

学科分类：A2901

资助金额：48.00

项目类别：面上项目

托卡马克等离子体自发旋转的实验研究

批准号：10975155

批准年份：2009

负责人：石跃江

学科分类：A2901

资助金额：45.00

项目类别：面上项目

HL-2A托卡马克芯部湍流的实验研究

批准号：11005037

批准年份：2010

负责人：石中兵

学科分类：A2904

资助金额：24.00

项目类别：青年科学基金项目

托卡马克等离子体粒子输运物理实验研究

批准号：10805015

批准年份：2008

负责人：肖维文

学科分类：A29

资助金额：23.00

项目类别：青年科学基金项目

基于NoSQL集群数据库的下一代托卡马克实验数据存储技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于MCPF算法的列车组合定位应用研究

智能煤矿建设路线与工程实践

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

区块链技术:从数据智能到知识自动化

偏正态数据下混合非线性位置回归模型的统计诊断

郑玮的其他基金

脑靶向抑制DMT1功能阻抑阿尔茨海默病转基因小鼠脑内β淀粉样蛋白沉积和tau蛋白异常磷酸化的分子机制

CEO价值观对企业创新投入、过程与绩效的影响——基于高阶理论与委托代理理论的融合视角

条件性敲除颅神经嵴源性间充质细胞Jagged1基因致小鼠腭发育不足机制的研究

二价金属离子转运体DMT1参与阿尔茨海默病发病的分子机制研究

不对称苯并氮杂氟硼二吡咯类荧光染料的合成及构效关系研究

细胞因子periostin在肌腱粘连中的作用及分子机制研究

相似国自然基金