大规模生物序列比对及其基于异构系统的并行处理技术研究

基本信息
批准号:61402400
项目类别:青年科学基金项目
资助金额:25.00
负责人:朱香元
学科分类:
依托单位:肇庆学院
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:陈建平,李坚,朱俊岭,田庆,吴岸雄,唐卓,王艳
关键词:
并行处理生物序列比对CUDA图形处理器异构系统
结项摘要

Biological sequence alignment is a fundamental research in bioinformatics. It is widely used in the research of phylogeny inference, protein structure and function prediction, and disease control. Due to its wide use, highly computational complexity, and massive data, multiple sequence alignment needs to support high performance computing urgently. On the other hand, with the development of high performance computing, it is an effective method to handle NP-hard biological problems on heterogeneous systems which combine CPU with GPU. This project investigates biological sequence alignment and its parallel processing techologies based on heterogeneous systems. First, a method is proposed to achieve load balancing by sequence data transformation. Then, many memory optimization methods, including a fully coalesced sequence accessing, similarity matrix storing and accessing, and scoring matrix computing and compressed storing, are developed to improve the performance of actual systems because of memory shortage. In the end, based on a memory pre-allocation and reuse strategy, a coarse-grained parallel algorithm for large-scale sequence alignment is proposed. This project will provide a useful tool for large-scale sequence alignment. It will also provide new ideas for other data-intensive applications, and then promote the development of related fields.

序列比对是生物信息学的基础性研究工作,已被广泛应用于进化分析、蛋白质结构和功能预测、疾病控制等方面。由于序列比对应用的广泛性、计算的复杂性以及海量的数据特征,对计算机性能提出了越来越高的要求,迫切需要高性能计算的支持。同时,随着高性能计算的快速发展,应用CPU+GPU异构系统求解各类NP-难解生物计算问题已变得越来越普及和流行。本项目研究大规模生物序列比对及其基于异构系统的并行处理技术。首先,对序列优化存储,设计异构系统负载平衡方法;然后,设计异构系统内存优化方法,包括满足合并访问条件的序列存储方法、相似矩阵存储和访问方式、得分矩阵压缩存储,解决由于异构系统存储空间的匮乏而导致的实际计算性能低下;最后,基于内存预分配和复用策略,提出粗粒度序列比对并行算法。本项研究将为生物信息学提供实际可用的序列比对工具,为设计其他数据密集型应用的异构系统解决方案提供新的思路,推动相关领域的发展。

项目摘要

序列比对是生物信息学的基础性研究工作,已被广泛应用于进化分析、蛋白质结构和功能预测、疾病控制等方面。由于序列比对应用的广泛性、计算的复杂性以及海量的数据特征,对计算机性能提出了越来越高的要求,迫切需要高性能计算的支持。同时,随着高性能计算的快速发展,应用CPU+GPU异构系统求解各类NP-难解生物计算问题已变得越来越普及和流行。本项目研究大规模生物序列比对及其基于异构系统的并行处理技术。首先,对序列优化存储,设计异构系统负载平衡方法;然后,设计异构系统内存优化方法,包括满足合并访问条件的序列存储方法、相似矩阵存储和访问方式、得分矩阵压缩存储,解决由于异构系统存储空间的匮乏而导致的实际计算性能低下;最后,基于内存预分配和复用策略,提出粗粒度序列比对并行算法。本项研究在三块NVIDIA GPU卡上进行性能测试,与传统的串行MAFFT 7.015算法相比,所提出的并行算法在Tesla K20m GPU上能取得11.28倍的加速。本项研究将为生物信息学提供实际可用的序列比对工具,为设计其他数据密集型应用的异构系统解决方案提供新的思路,推动相关领域的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

DOI:
发表时间:2018

朱香元的其他基金

相似国自然基金

1

面向异构并行系统的生物序列比对并行策略及算法研究

批准号:61173013
批准年份:2011
负责人:周炎涛
学科分类:F0204
资助金额:58.00
项目类别:面上项目
2

大规模并行处理系统程序并行化技术及其工具

批准号:69403009
批准年份:1994
负责人:金国华
学科分类:F0204
资助金额:7.00
项目类别:青年科学基金项目
3

基于异构平台的高复杂度生物序列分析算法并行化研究

批准号:61202127
批准年份:2012
负责人:夏飞
学科分类:F0204
资助金额:24.00
项目类别:青年科学基金项目
4

超长生物序列的数据存储与模式分析的并行处理技术研究

批准号:60273079
批准年份:2002
负责人:王国仁
学科分类:F0202
资助金额:22.00
项目类别:面上项目