分布式环境下分子系统发育分析高性能计算方法研究

基本信息
批准号:61602026
项目类别:青年科学基金项目
资助金额:21.00
负责人:凌诚
学科分类:
依托单位:北京化工大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:卢罡,李易禅,李嫚,张晓东,叶露,张瑶,王晶,刘魏魏
关键词:
进化树最大似然估计进化分析
结项摘要

The development of sequencing technology for molecular phylogenetic analysis has brought huge amounts of data. To quickly interpret huge amounts of data, revealing biological evolution pattern is one of the hot research topic. Research shows that high-performance parallel algorithm, for improving the efficiency of phylogenetic analysis is very important. However, phylogenetic trees in the multi-dimensional space have complex features, their likelihood estimations vary widely, resulting in bottlenecks in the existing parallel algorithms, including computing consistency, versatility, etc. Therefore, whether there are some better methods to achieve more efficient and stable computing performance, when performing the phylogenetic analysis for large-scale molecular sequences. Based on the early research achievements, This project propose the research for high performance phylogenetic analysis under a distributed computing environment. First, the research will evaluate the load balancing, and propose the consistency of the calculation method under network environment. Second, to be integrated with the concept of likelihood probability property and column-major storage schema, general purpose parallel computing method will be developed. Third, the proposed method will improve the efficiency of multi-threaded GPU computing by optimizing the thread-level concurrency, kernel scheduler, efficient computation ratio. This project performs theoretical and technological innovation of harnessing molecular evolution theory and high-performance computing technology to solve the calculation problem of molecular phylogenetic analysis, which will provide high efficient computing supports for a new generation of biomedical related research.

测序技术的发展为分子系统发育分析带来了海量数据。如何快速解读海量数据,揭示生物进化规律,是国内外研究热点之一。研究表明,高性能并行算法的研究,对于提高系统发育分析效率非常重要。然而,多维空间内的进化树特征复杂,似然估计千差万别,导致现有并行算法在计算一致性、通用性等方面存在瓶颈。那么,是否存在一些更好的解决思路,能够在为大规模分子序列进行系统发育分析时,取得更为高效、稳定的计算性能。本课题就是要基于前期的研究成果,研究分布式环境下分子进化分析的高性能计算方法。首先,本课题拟研究网络环境下的负载均衡、计算一致性方法。第二,拟融入似然概率属性概念,研究基于列主序存储模型的通用并行方法。第三,拟优化线程级并发度、内核调度、有效计算比例,提高GPU多线程计算效率。本项目是利用分子进化理论和高性能计算技术对求解分子进化分析计算问题所进行的理论和技术创新,将为新一代生物医药等研究提供高效计算支持。

项目摘要

多维空间内的进化树特征复杂,似然估计千差万别,导致现有并行算法在计算一致性、通用性等方面存在瓶颈。本课题基于前期的研究成果,研究分布式环境下分子进化分析的高性能计算方法。首先,本课题拟研究网络环境下的负载均衡、计算一致性方法。第二,拟融入似然概率属性概念,研究基于列主序存储模型的通用并行方法。第三,拟优化线程级并发度、内核调度、有效计算比例,提高GPU多线程计算效率。本项目是利用分子进化理论和高性能计算技术对求解分子进化分析计算问题所进行的理论和技术创新。 围绕研究目标,本项目研究了多种分子进化模型下的似然概率计算加速方法,通过转移概率矩阵与似然值一体化封装的加速优化,提出了基于列主序的通用并行计算方法和网络环境中组学分析负载均衡策略。此外,本项目提出了基于机器学习与高性能计算深度融合的似然概率计算的新方法。本项目方法在公共计算平台天河2-A上的运行速度显示了该方法在国际具备一定领先性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

凌诚的其他基金

相似国自然基金

1

高性能并行分布式仿真支撑环境研究

批准号:60574057
批准年份:2005
负责人:黄柯棣
学科分类:F03
资助金额:25.00
项目类别:面上项目
2

集群环境下基于内存的高性能数据管理与分析

批准号:61332006
批准年份:2013
负责人:周傲英
学科分类:F0202
资助金额:300.00
项目类别:重点项目
3

分布式环境下信任管理的可视分析关键技术研究

批准号:61202401
批准年份:2012
负责人:彭帝超
学科分类:F0205
资助金额:22.00
项目类别:青年科学基金项目
4

分布式环境下动力分析有限元并行算法与软件

批准号:19672032
批准年份:1996
负责人:程建钢
学科分类:A0813
资助金额:9.00
项目类别:面上项目