The genetic variants on chromosome not only affect gene function by changing amino acid substitution, but also regulate gene expression, chromotin state and thus phenotypes by cis-actions. Using RNA-seq read to measure the abundant of gene expression, and ChIP-seq and DNaseI-seq DNA read to describe chromotin state are able to detect cis-acting variant. Currently, the single variant method is applied for such dataset, but it usually has higher false discovery rate and lower power. A new method is developed, which estabilishes total read depth and ASE multiple-variants model, respectively; using Bayesian MCMC approach to estimate model parameters; joint total read depth model and ASE model lead to multi-traits analysis; joint GWAS model and cis-action model is able to test the cis-action of the GWAS variant. The new method is applied to pig RNA-seq dataset for exploring the landscape of the cis-acting variants. The new method is meaningful to study the genomic distribution rule of the cis-acting variants and test the cis-action of GWAS variant.
染色体上的遗传变异不仅能通过改变氨基酸影响基因功能,还可通过顺式作用调控基因表达和染色质状态来影响各种表型。通过RNA测序数据(测序read个数衡量基因表达量)、ChIP和DNaseI测序数据(描述染色质状态),辅以基因组变异信息,可实现顺式遗传变异的高分辨检测。目前对这种以read量化资料的顺式遗传变异检测主要以单变异模型为主,表现较高的假阳性率和较低的检测效力。分别建立总read深度和等位基因特异表达(ASE)的多变异模型,利用贝叶斯MCMC技术求解参数可高分辨解析多个顺式遗传变异;联合总read深度模型及ASE模型可实现多个顺式遗传变异的纵向解析;将顺式模型与GWAS模型联合可检验GWAS变异的顺式作用。新方法应用于猪的RNA-seq数据中,探索猪基因组顺式遗传变异分布的全景图。顺式遗传变异高分辨检测有助于认识顺式变异在基因组上的分布规律,也在GWAS信号的顺式作用验证中有重要意义。
(1)开发了新的eQTL检测算法:由于多个组织的基因表达量具有很强的相关性,同时结合多个组织表达量共同检测顺式eQTL,能够在很大程度上提高eQTL检测效率。本研究开发了一个eQTL检测的多组织联合检测方法,新方法基于多变量统计模型,同时利用多个组织的基因表达量资料,建立似然比统计量检测eQTL,与现有方法相比能够挖掘更多的eQTL。.(2)研究了大黄鱼全基因组顺式eQTL分布全景图:研究了大黄鱼肝脏及肌肉组织的全基因组顺式eQTL,发现了~2千个顺式eQTL及其附件靶基因,我们发现很多靶基因存在不止一个顺式eQTL,我们利用RNA-seq数据和全基因组测序技术挖掘大黄鱼肝脏组织的eQTL,利用向前选择发检测了每个靶基因多个eQTL,共发现了2,427个eQTLs,69.7%(1,691/2,427)的eQTL是主要eQTL信号,其他的为二级eQTL信号、三级eQTL信号等,大多数发现的基因具有重要生物学功能, eQTLs 距离靶基因的距离呈现正态分布,25.5%的eQTL距离靶基因1Mb区域,而74.5%的eQTL在1Mb与2Mb区域之间。.(3)研究了猪的全基因组顺式eQTL分布全景图:共鉴定出7192个顺式eQTL对应2098个顺式基因(p≤1.33e-3,FDR≤0.05),6400个反式eQTL对应863个反式基因(p≤1.13e-6,FDR≤0.05)。利用RNAseq单核苷酸多态性进行ASE分析,在2253个独特基因中鉴定出9815个显著的ASE单核苷酸多态性。通过对顺式eQTL与ASE靶基因的整合分析,共鉴定出540个共有基因,其中33个基因表达水平至少与一个肉质性状相关。在这540个普通基因中,63个已被报道为肉质性状的候选基因,如PHKG1(q值=1.67e-6)对于cis eQTL分析中的领先SNP),NUDT7(q值=5.67e-13),FADS2(q值=8.44e-5)和DGAT2(q值=1.24e-3)。结论:本研究证实了几个先前发表的候选基因,并鉴定了一些新的基因通过eQTL和ASE分析获得肉质性状的候选基因,这将有助于确定肉质性状候选基因的优先顺序进一步研究。.此外,我们也开发了全基因组个体亲缘关系矩阵简化计算方法及软件、开发了低深度重测序全基因组SNP分型技术,这些为eQTL的高效检测提供基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
钢筋混凝土带翼缘剪力墙破坏机理研究
基于高通量测序数据分析的微生物鉴定新方法及其在人类肠道微生物研究中的应用
利用高通量测序技术检测新生RNA二级结构及检验其对突变率的调节作用
基于高通量测序数据的isomiR功能研究
基于新一代测序数据的顺式调控模体预测与分析