In the animal genome-wide association study, single SNP analysis often identifies a number of the most significant SNPs that account for only a small proportion of the genetic variants, so that offers limited understanding of genetic variation about complex traits. By the observed information on SNPs and the knowledge about genes and pathway, we will conduct gene-based analysis coupled with pathway-based analysis, which can identify functional units for interpreting much larger genetic variation of complex traits. Kolmogorov-Smirnov and Maxmean statistics are introduced to characterize the impact of genes and path on the target traits and permutation test and re-standardization method are used to infer statistical significance. In order to reduce the collinearity among SNPs and considering the interaction between SNPs, we adopt the principal component analysis to extract independent analyzed units, which will improve computational efficiency and statistical accuracy and reliability. Computer simulation experiments will be used to demonstrate the effectiveness and adaptability of the proposed methods by comparing with the existing methods and other statistics. Our approaches will be applied to analyzing the genome-wide data on a series of public complex human diseases and slaughtering traits in Chinese Simmental cattle.
在动物全基因组关联研究中,单个SNP分析通常检测到大量显著的但作用很小的SNP,因而对复杂性状的遗传变异仅提供了有限的理解。以基因和生化或代谢路径等为分析目标,利用构成它们的SNP观测信息,能够鉴定可以解释复杂性状更大遗传变异的功能单位。引用Kolmogorov-Smirnov和Maxmean统计量来表征基因和路径对目标性状的影响,采用置换检验或重标准化方法去判定基因和路径对目标性状作用的显著性。为了降低构成基因集SNP间的共线性对分析结果的影响,并考虑SNP间的交互作用,我们又引入主成分分析方法,从大量相关和互作的SNP中提炼出较少的独立分析单元,以期提高估计基因和路径遗传作用的计算效率以及统计的准确性和可靠性。计算机模拟验证和检验新方法的有效性和适应性,并与现行方法和其他统计量进行比较。新方法将应用于一系列公开使用的人类复杂疾病全基因组数据和中国西门达尔牛屠宰性状的全基因组关联分析。
伴随着基因组测序和高通量单核苷酸多态性(SNP)基因分型技术的发展,全基因组关联分析(GWAS)方法已经成为研究控制人类复杂疾病路径和家畜重要经济数量性状位点的遗传基础的强大有力并且经济实用的方法。在家畜方面,研究者开展了大量的GWAS研究,并且检测到了许多控制重要经济性状位点的新基因。然而,在每一步的统计推断中,他们都假设每一个分析单元之间是相互独立的,这与基因组上SNP间广泛地存在着连锁关系相矛盾。.我们提出了修正的基于路径的全基因组关联分析方法。研究只考虑SNP或基因单独作用的基因凝聚分析方法,这里引用Kolmogorov-Smirnov和Maxmean统计量实现从SNP到基因再到路径的两阶段非参数分析策略。研究考虑SNP或基因间交互作用的基因凝聚分析方法,这里考虑主成分分析方法提高基因凝聚分析的计算效率。利用计算机模拟技术系统分析各种因素对所提出方法检测结果的影响,并与其它现行方法进行了比较分析,论证了所建议方法的可靠性和适应性。拓展了GSEA软件包,正在申请两项计算机软件著作权。进一步地将该方法拓广去研究生存性状的遗传结构和检测调节畜禽异速生长的QTL。.在项目完成过程中,在Scientific Reports上发表SCI论文1篇,国内核心刊物论文2篇,还有1篇EI文章正在审稿中。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于网络的全基因组关联分析方法
基于基因集富集分析的奶牛全基因组关联分析方法研究
稀疏全基因组关联分析方法研究
泛全基因组关联分析:人类复杂疾病全基因组关联分析的整合研究