大规模生物序列比对及其基于异构系统的并行处理技术研究

基本信息

批准号：61402400

项目类别：青年科学基金项目

资助金额：25.00

负责人：朱香元

学科分类：

依托单位：肇庆学院

批准年份：2014

结题年份：2017

起止时间：2015-01-01 - 2017-12-31

项目状态：已结题

项目参与者：陈建平,李坚,朱俊岭,田庆,吴岸雄,唐卓,王艳

关键词：

并行处理生物序列比对CUDA图形处理器异构系统

结项摘要

Biological sequence alignment is a fundamental research in bioinformatics. It is widely used in the research of phylogeny inference, protein structure and function prediction, and disease control. Due to its wide use, highly computational complexity, and massive data, multiple sequence alignment needs to support high performance computing urgently. On the other hand, with the development of high performance computing, it is an effective method to handle NP-hard biological problems on heterogeneous systems which combine CPU with GPU. This project investigates biological sequence alignment and its parallel processing techologies based on heterogeneous systems. First, a method is proposed to achieve load balancing by sequence data transformation. Then, many memory optimization methods, including a fully coalesced sequence accessing, similarity matrix storing and accessing, and scoring matrix computing and compressed storing, are developed to improve the performance of actual systems because of memory shortage. In the end, based on a memory pre-allocation and reuse strategy, a coarse-grained parallel algorithm for large-scale sequence alignment is proposed. This project will provide a useful tool for large-scale sequence alignment. It will also provide new ideas for other data-intensive applications, and then promote the development of related fields.

序列比对是生物信息学的基础性研究工作，已被广泛应用于进化分析、蛋白质结构和功能预测、疾病控制等方面。由于序列比对应用的广泛性、计算的复杂性以及海量的数据特征，对计算机性能提出了越来越高的要求，迫切需要高性能计算的支持。同时，随着高性能计算的快速发展，应用CPU+GPU异构系统求解各类NP-难解生物计算问题已变得越来越普及和流行。本项目研究大规模生物序列比对及其基于异构系统的并行处理技术。首先，对序列优化存储，设计异构系统负载平衡方法；然后，设计异构系统内存优化方法，包括满足合并访问条件的序列存储方法、相似矩阵存储和访问方式、得分矩阵压缩存储，解决由于异构系统存储空间的匮乏而导致的实际计算性能低下；最后，基于内存预分配和复用策略，提出粗粒度序列比对并行算法。本项研究将为生物信息学提供实际可用的序列比对工具，为设计其他数据密集型应用的异构系统解决方案提供新的思路，推动相关领域的发展。

项目摘要

序列比对是生物信息学的基础性研究工作，已被广泛应用于进化分析、蛋白质结构和功能预测、疾病控制等方面。由于序列比对应用的广泛性、计算的复杂性以及海量的数据特征，对计算机性能提出了越来越高的要求，迫切需要高性能计算的支持。同时，随着高性能计算的快速发展，应用CPU+GPU异构系统求解各类NP-难解生物计算问题已变得越来越普及和流行。本项目研究大规模生物序列比对及其基于异构系统的并行处理技术。首先，对序列优化存储，设计异构系统负载平衡方法；然后，设计异构系统内存优化方法，包括满足合并访问条件的序列存储方法、相似矩阵存储和访问方式、得分矩阵压缩存储，解决由于异构系统存储空间的匮乏而导致的实际计算性能低下；最后，基于内存预分配和复用策略，提出粗粒度序列比对并行算法。本项研究在三块NVIDIA GPU卡上进行性能测试，与传统的串行MAFFT 7.015算法相比，所提出的并行算法在Tesla K20m GPU上能取得11.28倍的加速。本项研究将为生物信息学提供实际可用的序列比对工具，为设计其他数据密集型应用的异构系统解决方案提供新的思路，推动相关领域的发展。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12354/j.issn.1000-8179.2021.20201763

发表时间：2021

DOI：10.7524 /j.issn.0254-6108.2017122903

发表时间：2018

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.13343/j.cnki.wsxb.20200479

发表时间：2021

朱香元的其他基金

相似国自然基金

面向异构并行系统的生物序列比对并行策略及算法研究

批准号：61173013

批准年份：2011

负责人：周炎涛

学科分类：F0204

资助金额：58.00

项目类别：面上项目

大规模并行处理系统程序并行化技术及其工具

批准号：69403009

批准年份：1994

负责人：金国华

学科分类：F0204

资助金额：7.00

项目类别：青年科学基金项目

基于异构平台的高复杂度生物序列分析算法并行化研究

批准号：61202127

批准年份：2012

负责人：夏飞

学科分类：F0204

资助金额：24.00

项目类别：青年科学基金项目

超长生物序列的数据存储与模式分析的并行处理技术研究

批准号：60273079

批准年份：2002

负责人：王国仁

学科分类：F0202

资助金额：22.00

项目类别：面上项目

大规模生物序列比对及其基于异构系统的并行处理技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

外泌体在胃癌转移中作用机制的研究进展

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

复杂系统科学研究进展

猪链球菌生物被膜形成的耐药机制

朱香元的其他基金

相似国自然基金