Genome-wide association studies have proposed a key to complex disease, though the SNPs variants identified from GWAS explain only a small proportion of heritability. One reason is that the human complex disease can not only be controlled by DNA in human genome, but RNA and some other factors . the other is that most statistical approaches for GWAS is mainly based on single SNP, some gene-based methods only consider the interaction between two genes. From the perspective of system biology and network biology, based on case-control design and GWAS SNP data, this program will construct the genetic network in case and control respectively by treating genes in some specified biochemistry pathway as nodes. A new statistic based on partial least square path modeling will be adopted to compare the topology structure between these two networks, then we can explore the different gene co-association, and illustrate the network genetic mechanism for the disease. Furthermore, the statistical inference methods for comparison between gene-gene network will be constructed .
全基因组关联研究(GWAS)打开了一扇通往研究复杂疾病的大门,但其研究得到的有统计显著性的SNP位点仅仅只能解释疾病的一小部分遗传度,这既有遗传学机制层面的问题,又有数据分析方面的问题,遗传层面上,人类复杂疾病不仅受基因组上的DNA控制,而且还受到RNA等多方面的影响,数据层面上,多是单一SNP分析,部分以整体基因为单位的方法也仅仅考虑两两交互作用,本项目从系统生物学和网络生物学角度,针对病例对照设计,基于GWAS SNP数据,以特定生化通路内整体基因为单位,分别构建在疾病和健康两个不同状态下通路内的基因网络,采用基于偏最小二乘路径模型构建的新型统计量,对这两种状态下网络的拓扑结构进行比较,发现网络中哪些基因的连接存在差异,鉴定那些因条件不同而改变的基因关联,进而揭示疾病产生的内在网络遗传机制,并构建"全基因组关联分析中基因-基因交互网络比较的统计推断方法体系"。
本项目从系统生物学和网络生物学角度,针对病例对照设计,以特定生化通路内整体基因为单位,分别构建在疾病和健康两个不同状态下的基因网络,并对这两种状态下网络的拓扑结构进行比较,发现网络中哪些基因及其连接存在差异,鉴定那些因条件不同而改变的基因关联,进而揭示疾病产生的内在网络遗传机制,并构建"全基因组关联分析中基因-基因交互网络比较的统计推断方法体系"。所完成的代表性成果包括:(1)从概率图模型的新视角阐明了两基因之间共关联作用的概念原理,以及它与两基因间交互作用的区别与联系,并提出了两个基于Fisher变换的基因-基因共关联统计量。(2)基于多因变量对多自变量的回归理论,面对基因组内SNP的高度共线性采用偏最小二乘(PLS)和稀疏偏最小二乘(SPLS)回归,构建了多数量性状全基因组区域化关联分析扫描统计量。(3)针对课题组前期发展的基因-基因共关联检测方法均需采用非参数方法逼近理论分布,计算负担严重等缺陷,提出了一种有效的基于得分检验的卡方统计量,用于对基因-基因共关联作用的深度挖掘。(4) 在系统流行病学框架下,提出了基于bootstrap的通路效应测量方法,用于有效检测生物医学中特定通路对疾病的效应,为全面洞察疾病潜在网络机制提供了可行的方法。(5)基于经典的得分统计量,考虑到不同组间生物网络的差异应具有点和边共变的属性,提出了一种新型的用于检验无向生物网络组间差异的统计量。(6)在上述无向网络差异检验统计量的基础上,进一步用加权的方式来体现不同网络节点的调控权重,提出了加权统计量,用来检验有向生物网络的组间差异。这一系列生物网络比较的统计推断方法体系的建立,可为进一步的实验室功能验证提供统计学指导,并为揭开疾病的内在网络机制提供新思路。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
涡度相关技术及其在陆地生态系统通量研究中的应用
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
全基因组关联研究中基因-基因、基因-环境交互作用统计分析方法研究
基于全基因组概括关联统计量的统计建模与推断
畜禽全基因组关联分析中基因交互作用检测方法研究
基于网络的全基因组关联分析方法