基于GPU并行计算的复杂疾病基因互作关联分析新方法研究

基本信息
批准号:81803330
项目类别:青年科学基金项目
资助金额:21.00
负责人:任文龙
学科分类:
依托单位:南通大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:何书,沈欢,梁源源
关键词:
多基因背景控制全基因组关联分析并行运算基因互作图形处理单元
结项摘要

Genome-wide association study (GWAS) is a powerful tool for investigating the genetic architecture of complex diseases and have identified thousands of variants. The interaction between genetic loci (epistasis) is thought to play an important role in defining the genetic architecture underlying complex disease and contribute to missing heritability. Currently, most of the available epistatic methods are focused on the case-control trait, and there are few ways to deal with the continuous trait. Even though existed several epistasis methods for handling continuous traits, they are based on simple detection of gene pairs without considering polygenic background. Therefore, we will study the rapid methods of epistatic detection for complex diseases, as follows: 1) Improve the existing multi-locus mixed linear model method MRMLM, and the original main effect model is extended to the main effect plus epistasis model with considering polygenic background. 2) Based on the GPU (graphic processing units), the proposed new method is accelerated in parallel, and the performance of the new method is tested by the simulation data and the real data of WTCCC. 3) The new method will be developed as a software package, respectively, in the Linux system and Windows system, and a user-friendly interface is developed only for Windows system.

全基因组关联分析是研究复杂疾病遗传结构的有力工具,并已成功鉴定出数千种变异体。基因之间的相互作用(上位性)被认为在确定复杂疾病的遗传结构中起重要作用,并且导致遗传率缺失。目前存在的上位性方法大多是针对于疾病-对照的性状,处理连续型性状的方法较少。即使存在的几种处理连续型性状的上位性方法都是基于基因对的简单检测,没有考虑多基因背景控制。本项目拟研究复杂疾病上位性检测的快速方法,将开展:1)对现有的多位点混合线性模型方法MRMLM进行改进,将原来的主效模型,拓展成主效+上位性模型,并考虑多基因背景控制;2)基于图形处理单元(GPU)对提出的新方法进行并行加速,并通过模拟数据和WTCCC真实数据,对新方法的性能进行测试;3)将新方法在Linux系统下和Windows系统下分别开发一套软件包,其中,Winodws系统下开发一个友好用户界面。

项目摘要

现有的基因-基因互作方法多数对单个效应检测,并且未考虑多基因背景效应,在运算时间、假阳率和统计功效等方面有待进一步优化。为此,本项目提出了两种高效精准的全基因组关联分析(GWAS)新方法:(1).基于限制最大似然和惩罚最大似然的新方法(HRePML)。1).在混合线性模型(MLM)框架下,REML过程扫描单个基因-基因互作效应时进行多基因背景控制,采用谱分解快速求解方差组分;PML过程同时对多个基因-基因互作效应进行扫描。2).使用C++语言开发了HRePML新方法对应的Linux和Windows版本软件,并且支持英特尔数学内核库(Intel MKL)并行计算。(2).基于得分测试和经验贝叶斯的新方法(ScoreEB)。1).在MLM框架下,利用背景控制下的得分测试对基因-基因互作效应初步筛选,采用矩估计快速求解方差组分,并使用预处理共轭梯度法(PCG)近似求解大样本时的线性方程;保留下来的基因-基因互作效应同时放入多位点MLM中,采用经验贝叶斯的方法对这些互作效应进行压缩估计。2).开发了ScoreEB新方法的R软件包,通过Microsoft R Open可以实现并行计算,可通过CRAN或者GitHub免费获取。与原有的MRMLM方法相比,HRePML和ScoreEB新方法秉承了其高功效和低假阳率的性质,同时,运算速度得到提高,在样本量为2000时,HRePML加速约1.5倍,ScoreEB加速约4倍。本项目为复杂疾病基因-基因互作的检测提供了理论方法和软件支持。发表SCI论文2篇,申请GPU算法发明专利1项,登记软件著作权2项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020

任文龙的其他基金

相似国自然基金

1

复杂疾病基因与环境互作模型分析方法研究

批准号:31371336
批准年份:2013
负责人:崔跃华
学科分类:C0609
资助金额:70.00
项目类别:面上项目
2

基于BIM技术及GPU并行计算的复杂结构快速建模和分析

批准号:51708147
批准年份:2017
负责人:李红豫
学科分类:E0804
资助金额:21.00
项目类别:青年科学基金项目
3

基于高阶SNP互作挖掘与分析的复杂疾病全基因组关联研究

批准号:61772124
批准年份:2017
负责人:赵宇海
学科分类:F0202
资助金额:64.00
项目类别:面上项目
4

面向全基因组关联的复杂疾病遗传互作网络研究与分析

批准号:61373051
批准年份:2013
负责人:刘桂霞
学科分类:F0213
资助金额:76.00
项目类别:面上项目