Multiple sclerosis (MS) is an autoimmune disease in the human central nervous system. In recent years, hundreds of MS risk SNPs in European populations have been identified based on the genome-wide association studies (GWAS). However, the majority of these SNPs are located in the non-coding regions in the genome, and the genes through which these risk SNPs exert their effects on MS are often unknown. Expression Quantitative Trait Loci (eQTL) data provide us which genes are regulated by SNPs. Therefore, in this project, we aim at identifying MS risk genes and genetic pathways in European populations through new machine learning methods. Due to genetic heterogeneity between the different populations, we will collect Chinese MS and normal samples, and check whether the MS risk SNPs in European populations are related to the susceptibility in Chinese populations. The completion of this project will help to reveal the pathogenesis of MS, and to provide a reference for the prevention, diagnosis, and treatment of MS, which has important theoretical and practical value.
多发性硬化(MS)是一种中枢神经系统自身免疫性疾病。近年来,在欧洲人群中通过全基因组关联研究(GWAS)识别了数百个MS的风险SNP。然而,绝大部分MS风险SNP位于基因组的非编码区域,仍不清楚这些位于非编码区的MS风险SNP通过调控哪些基因的表达来影响MS的形成与发展。表达数量性状位点(expression Quantitative Trait Loci, eQTL)做为组织调控表达数据,提供了SNP到基因的调控信息。因此,本项目旨在整合eQTL数据及欧洲MS人群的GWAS数据,开发新型机器学习方法来识别欧洲MS人群的风险基因及遗传通路。由于人种之间的遗传异质性,拟进一步采集中国MS及正常人的样本,通过生物实验及数据分析,研究欧洲MS人群的风险基因在中国人群中的易感性。本项目的完成将有助于揭示MS的发病机制、为制定MS的预防、诊断及治疗方案提供参考,具有重要的理论及实用价值。
近年来,人类复杂疾病遗传性定量分析主要依赖GWAS来识别常见遗传变异,确定了许多新的影响人类复杂疾病遗的传变异、易感基因和特定生物学通路。虽然GWAS研究已经确定了与多种复杂疾病相关的SNP,其中包含多发性硬化,但是这些SNP大多数位于非编码区。有研究表明,落在非编码区的SNP有一部分具有调控功能(regulatory SNP),即位于顺式作用元件(如启动子、增强子、沉默子、绝缘子等)上并能够改变基因表达水平的SNP 。如果一个SNP能够调控附近基因的表达,那么这样的SNP我们称为表达数量性状位点(expression Quantitative Trait Loci, eQTLs),被调控的基因就有可能是疾病易感基因。未来的研究新趋势是将多组学数据以及临床中间表型整合到GWAS研究中。.目前多发性硬化GWAS报道的遗传变异大多数位于基因的非编码区。前期人类复杂疾病的研究表明,一部分落在非编码区的SNP可以顺式作用调控基因表达。落在非编码区的遗传变异,是否以顺式作用调控多发性硬化易感基因表达,是我们本研究的主要内容。是否能够顺利解决直接影响到整合基因组关联研究数据和组织调控表达数据,识别新的多发性硬化风险基因和遗传通路的研究效果。我们基于多发硬化症的多发性,我们选取来自基因型-组织表达(Genotype-Tissue Expression, GTEx)数据库中的449个个体的44个人类组织共计7051个组织样本数据 。在每个组织中,我们分别整合基因组关联研究数据和组织调控表达数据,从而识别在不同组织中影响多发性硬化易感基因。本研究中,我们扩展了以前的研究工作,克服了多发性硬化单一GWAS层面的局限性,将转录组学整合到多发性硬化GWAS研究中。通过整合现有的基因组和组织调控表达数据识别新的多发性硬化风险基因和遗传通路,并利用中国人群数据进一步验证以上发现。该研究结果的确立,将显著改善对多发性硬化发病机制的理解,为我国多发性硬化精准医学研究奠定科学基础,并进一步推动精准医疗的发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
内点最大化与冗余点控制的小型无人机遥感图像配准
卫生系统韧性研究概况及其展望
分析基因组关联研究数据识别阿尔茨海默和帕金森疾病相关的风险位点和遗传通路
结合基因条件关联检验和组织特异性表达谱解析全基因组关联信号的方法研究
泛全基因组关联分析:人类复杂疾病全基因组关联分析的整合研究
梅花花期性状的全基因组关联分析和遗传机制解析