大规模星表数据的高效时序重构算法研究

基本信息
批准号:11803022
项目类别:青年科学基金项目
资助金额:25.00
负责人:赵青
学科分类:
依托单位:天津科技大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:孙超,熊聪聪,韩书杰,孔乐,李琨,付立艳
关键词:
时域天文学虚拟天文台高性能计算海量数据处理数据融合
结项摘要

The sequential reconstruction of the catalog data refers to the process of do astrological identification between massive catalogs with same target sources to determine the correspondence between different observations of each star, and sort to generate temporal data for each object. It is the basis of time domain analysis and light curve fitting. With the continuous development of astronomical observation to large view field and high frequency sampling under the background of time domain astronomy, the efficient sequential reconstruction of large-scale catalog data poses a typical challenge. This project intends to realize the efficient localization and access of the time and space data subsets by optimizing the index and layout strategies of the catalogs, and study the load-free access model of the original data based on file pointers for the NoSQL model, in order to reduce the big time and space cost of data transfer in the traditional scheme. And research on the Xmatch method based on position alignment of the local sky area, to reduce the computation complexity of distance calculation in traditional Xmatch. Through the design of the phased identification strategy combined with the information of magnitude, the filtering of different kinds of celestial bodies and the precise configuration of accuracy and efficiency of each stage are realized. In this project, we plan to realize the high-performance of catalog sequential reconstruction through the above research on data access and storage, and design of the identification method, in order to improve the generation efficiency of astronomical temporal data product, and accelerate the research development of Time Domain Astronomy in our country.

星表数据的时序重构是指对有相同目标源的批量星表进行天体证认确定每一星体在不同观测记录间的对应关系,排序生成每个天体的时间序列数据的过程。它是拟合光变曲线、开展时域分析研究的基础。随着时域天文学背景下天文观测向大视场、高频率采样方向的不断发展,大规模星表数据的高效时序重构成了典型挑战。本项目拟通过对星表的索引和存储策略优化实现时空子集的高效定位和访问,通过NoSQL模型下基于文件指针的数据直接访问模式的扩展研究减少传统方案下数据转存的时空开销;研究基于局部天区位置校正的证认算法,减少传统交叉证认中距离计算的计算量;通过结合星等信息的分阶段证认策略设计,实现不同类别天体的过滤,以及各阶段准确度和效率的精细配置。项目拟通过上述访存和证认算法上的研究实现海量星表的高效时序重构,提高天文时序数据产品的生成效率,促进我国时域天文学研究的快速发展。

项目摘要

星表数据的时序重构是拟合光变曲线、开展时域分析研究的基础。随着时域天文学背景下天文观测向大视场、高频率采样方向的不断发展,大规模星表数据的高效时序重构成了典型挑战。. 项目首先研究面向天文时空子集提取的访问存储优化策略。设计了基于HEALPix最大均衡层的数据划分方法、使用图划分和空间聚合算法计算出一个最优的Fits文件数据布局策略,并设计出AstroLayout工具用以聚合FITS文件的邻近观测区域,从而优化数据访问性能。然后,优化时序证认计算过程的星体证认性能和准确度。为了提升证认过程的并行执行效率,针对分布式环境和多核环境,分别设计了基于阶段性静态-动态加权轮询分配算法的负载均衡算法和基于动态规划的改进背包问题的负载均衡算法;此外,针对数据分割后的分块边缘产生的边界漏源问题,设计了两种解决方案,其一为基于重叠索引方法和内存引用表的处理方法,其二为基于传输与计算重叠的处理方法,从而在保证星体证认准确度的同时尽可能提升性能。再后,进行了NoSQL模式下原始数据免加载技术的研究和面向图像时空子集提取的批处理模式感知的缓存管理算法的研究。此外,针对天文数据处理常用的云平台科学工作流进行了资源分配和任务调度的优化研究,分别设计了基于改进PSO算法和改进遗传算法的批处理科学工作流调度算法,以进一步提高证认任务执行效率。最后,针对所生成的天文时序数据和光变曲线数据进行了机器学习算法应用的扩展研究,可变天体光变曲线的全面探索不可缺少机器学习和深度学习的新技术。研究回顾了近年来光变曲线分析的重要进展,总结了机器学习的基本概念及其在光曲线分析中的应用,并总结了在不久的将来光变曲线分析的前景和挑战。. 本项目通过以上关键问题的研究,提高海量天文时序数据产品的生成效率,以促进我国时域天文学数据软件的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020

赵青的其他基金

批准号:81141101
批准年份:2011
资助金额:10.00
项目类别:专项基金项目
批准号:81372466
批准年份:2013
资助金额:65.00
项目类别:面上项目
批准号:81870745
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:11275045
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:51102276
批准年份:2011
资助金额:24.00
项目类别:青年科学基金项目
批准号:10775029
批准年份:2007
资助金额:35.00
项目类别:面上项目
批准号:41703107
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:51704068
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:61671447
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:81371113
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:30801206
批准年份:2008
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

大规模生物数据计算的优化建模与高效算法研究

批准号:61872281
批准年份:2018
负责人:王宇平
学科分类:F0213
资助金额:63.00
项目类别:面上项目
2

大规模图像数据自动标注算法研究

批准号:60873178
批准年份:2008
负责人:薛向阳
学科分类:F0605
资助金额:30.00
项目类别:面上项目
3

面向大规模机器学习的高效优化算法研究

批准号:61806128
批准年份:2018
负责人:彭涵阳
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
4

射电星表与多波段数据自动化证认方法研究

批准号:11503051
批准年份:2015
负责人:樊东卫
学科分类:A1904
资助金额:23.00
项目类别:青年科学基金项目