基于NoSQL集群数据库的下一代托卡马克实验数据存储技术研究

基本信息
批准号:11605068
项目类别:青年科学基金项目
资助金额:22.00
负责人:郑玮
学科分类:
依托单位:华中科技大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:丁同海,马少翔,柳强,胡斐然,万宽红,李阳
关键词:
NoSQL数据存储计算机集群存储托卡马克数据采集
结项摘要

As the tokamak discharge goes towards long pulse and faster digitizers are used in more sophisticated diagnostics, the scientific data generated during the experiment pulse is getting extremely larger. The future tokamaks like ITER and CFETR will produce hundreds times of data than today’s major tokamaks. Through their life, the demands will keep growing. Current available technologies in fusion community are hard to scale and cannot handle big data efficiently, they may barely meet the requirement of future tokamaks. This project attempts to find a solution for large tokamak scientific data archiving by using NoSQL cluster database technology. It will provide a storage and management system that can out performance the current available solutions and easily scale-out its capability, performance at low cost, but relies on no specific hardware technology. This technology will satisfy the continuously growing need for large scientific data storage of the future tokamaks and provide a good reference for future tokamak scientific data storage development.

随着托卡马克实验向长脉冲发展和高速、高精度的数据采集的应用,托卡马克实验产生的数据量也在高速增长,ITER、CFETR等未来托卡马克装置产生的数据量将是目前装置的上百倍,且会随着装置的发展和持续运行不断增长。这对目前聚变领域现有的存储技术在高性能、高扩展性、高可靠性等方面提出了严峻的挑战,因此非常有必要对托卡马克实验数据存储技术进行前瞻性探索研究。本项目将探索利用新兴的NoSQL集群数据库技术,研究并实现一种容量与性能可方便地横向扩展,具有高并发性能、高可靠性的下一代托卡马克实验数据存储技术。所研究的数据存储技术不依赖任何特定的存储硬件,可大大降低实现成本。本项目有望给出基于NoSQL集群数据库的下一代托卡马克实验数据存储技术方案,为ITER、CFETR等未来托卡马克数据存储系统的研制提供重要参考。

项目摘要

托卡马克实验数据存储系统存储来自诊断系统的所有科学数据,并提供管理、检索、访问这些数据的方法以实现实验数据分析,是托卡马克实验研究开展必需的系统。随着托卡马克实验向稳态长脉冲发展,以及诊断技术的发展,托卡马克实验产生的科学数据急剧增长。未来托卡马克装置数据存储系统必须具有更高的性能和容量,还需要在不影响实验的情况下方便地对系统的容量和读写性能进行扩展。目前主流的并行文件系统如GlusterFS、Lustre等技术本质上是由Object Storage集群实现,上层封装兼容POSIX文件系统API,对于聚变实验数据这种自身非结构化的数据来说存在额外性能开销。.本项目研究中成功的使用MongoDB与Cassandra NoSQL集群数据库分别实现了两种用于聚变实验存储的系统,在不实现POSIX文件系统API的情况下实现对聚变装置实验数据的存储服务。通过研究和优化测试,我们采用Cassandra集群数据库设计了优化的负载平衡策略,实现聚变实验数据的存储引擎,采用MongoDB实现了结构化的实验数据Metadata存储,并设计了一整套聚变实验数据存储系统原型。.该项目中研发的J-TEXT Cloud Database(JCDB)存储系统集群在数据量增加并且获得了接近线性的增加节点性能提升,在应用于聚变实验诊断数据存储时,性能超过主流的GlusterFS,与ITER计划采用方案BeeGFS与HDF5文件格式性能相当。在此研究成果上,我们实现了J-TEXT破裂数据库系统,实现高效的破裂相关诊断实验数据的存储与检索,为破裂预测研究提供了支持。本项目证明了NoSQL用于聚变实验数据存储的可能性,给出了其实现方案,与现有先进技术进行了对比,为未来聚变装置实验数据存储提供了参考和候选方案。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

五轴联动机床几何误差一次装卡测量方法

五轴联动机床几何误差一次装卡测量方法

DOI:
发表时间:
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

郑玮的其他基金

批准号:81471112
批准年份:2014
资助金额:70.00
项目类别:面上项目
批准号:71902029
批准年份:2019
资助金额:18.00
项目类别:青年科学基金项目
批准号:31201087
批准年份:2012
资助金额:21.00
项目类别:青年科学基金项目
批准号:81000468
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:21601060
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:81902214
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

托卡马克自举电流成分的实验研究

批准号:11075092
批准年份:2010
负责人:王文浩
学科分类:A2901
资助金额:48.00
项目类别:面上项目
2

托卡马克等离子体自发旋转的实验研究

批准号:10975155
批准年份:2009
负责人:石跃江
学科分类:A2901
资助金额:45.00
项目类别:面上项目
3

HL-2A托卡马克芯部湍流的实验研究

批准号:11005037
批准年份:2010
负责人:石中兵
学科分类:A2904
资助金额:24.00
项目类别:青年科学基金项目
4

托卡马克等离子体粒子输运物理实验研究

批准号:10805015
批准年份:2008
负责人:肖维文
学科分类:A29
资助金额:23.00
项目类别:青年科学基金项目