Genome-wide association study (GWAS) is a powerful tool for investigating the genetic architecture of complex diseases and have identified thousands of variants. The interaction between genetic loci (epistasis) is thought to play an important role in defining the genetic architecture underlying complex disease and contribute to missing heritability. Currently, most of the available epistatic methods are focused on the case-control trait, and there are few ways to deal with the continuous trait. Even though existed several epistasis methods for handling continuous traits, they are based on simple detection of gene pairs without considering polygenic background. Therefore, we will study the rapid methods of epistatic detection for complex diseases, as follows: 1) Improve the existing multi-locus mixed linear model method MRMLM, and the original main effect model is extended to the main effect plus epistasis model with considering polygenic background. 2) Based on the GPU (graphic processing units), the proposed new method is accelerated in parallel, and the performance of the new method is tested by the simulation data and the real data of WTCCC. 3) The new method will be developed as a software package, respectively, in the Linux system and Windows system, and a user-friendly interface is developed only for Windows system.
全基因组关联分析是研究复杂疾病遗传结构的有力工具,并已成功鉴定出数千种变异体。基因之间的相互作用(上位性)被认为在确定复杂疾病的遗传结构中起重要作用,并且导致遗传率缺失。目前存在的上位性方法大多是针对于疾病-对照的性状,处理连续型性状的方法较少。即使存在的几种处理连续型性状的上位性方法都是基于基因对的简单检测,没有考虑多基因背景控制。本项目拟研究复杂疾病上位性检测的快速方法,将开展:1)对现有的多位点混合线性模型方法MRMLM进行改进,将原来的主效模型,拓展成主效+上位性模型,并考虑多基因背景控制;2)基于图形处理单元(GPU)对提出的新方法进行并行加速,并通过模拟数据和WTCCC真实数据,对新方法的性能进行测试;3)将新方法在Linux系统下和Windows系统下分别开发一套软件包,其中,Winodws系统下开发一个友好用户界面。
现有的基因-基因互作方法多数对单个效应检测,并且未考虑多基因背景效应,在运算时间、假阳率和统计功效等方面有待进一步优化。为此,本项目提出了两种高效精准的全基因组关联分析(GWAS)新方法:(1).基于限制最大似然和惩罚最大似然的新方法(HRePML)。1).在混合线性模型(MLM)框架下,REML过程扫描单个基因-基因互作效应时进行多基因背景控制,采用谱分解快速求解方差组分;PML过程同时对多个基因-基因互作效应进行扫描。2).使用C++语言开发了HRePML新方法对应的Linux和Windows版本软件,并且支持英特尔数学内核库(Intel MKL)并行计算。(2).基于得分测试和经验贝叶斯的新方法(ScoreEB)。1).在MLM框架下,利用背景控制下的得分测试对基因-基因互作效应初步筛选,采用矩估计快速求解方差组分,并使用预处理共轭梯度法(PCG)近似求解大样本时的线性方程;保留下来的基因-基因互作效应同时放入多位点MLM中,采用经验贝叶斯的方法对这些互作效应进行压缩估计。2).开发了ScoreEB新方法的R软件包,通过Microsoft R Open可以实现并行计算,可通过CRAN或者GitHub免费获取。与原有的MRMLM方法相比,HRePML和ScoreEB新方法秉承了其高功效和低假阳率的性质,同时,运算速度得到提高,在样本量为2000时,HRePML加速约1.5倍,ScoreEB加速约4倍。本项目为复杂疾病基因-基因互作的检测提供了理论方法和软件支持。发表SCI论文2篇,申请GPU算法发明专利1项,登记软件著作权2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
复杂疾病基因与环境互作模型分析方法研究
基于BIM技术及GPU并行计算的复杂结构快速建模和分析
基于高阶SNP互作挖掘与分析的复杂疾病全基因组关联研究
面向全基因组关联的复杂疾病遗传互作网络研究与分析