Genome-wide association study is the most popular and successful approach for dissecting the genetics of complex disease. But, privacy concerns and other logistical considerations often restrict access to individual-level data. Nevertheless, summary association statistics are often readily available, and analyses of summary association statistics also offers the advantages in computational cost. These advantages have motivated the rapid development of statistical methods for deeply mining the summary association statistics. In this project, we are motivated by the summary association statistics and scientific problems arisen from the genetics study of myopia, aiming to study the statistical modeling and inference problems arisen from the summary association statistics. We will develop an analytical framework for complex disease based on the summary association statistics, helping understand the common physiological process and reveal the genetic architecture of complex disease in question.
全基因组关联研究是目前定位易感基因、探索遗传因素对复杂疾病影响最成功、最有效的方法。由于数据保密性的原因,全基因组关联研究的原始测序数据往往仅限于内部研究成员使用。但是,我们常常能获取全基因组关联研究的概括关联统计量(Summary Association Statistics)。概括关联统计量有容易获取、计算方便等优点,利用概括关联统计量进行深入挖掘成为了遗传统计学热门的研究课题。本项目以近视遗传学研究为背景以及突破点,以全基因组概括关联统计量为数据驱动,研究概括关联统计量的建模与统计推断问题,发展一套基于概括关联统计量的分析体系,帮助人们进一步认识复杂疾病的遗传机制。
全基因组关联研究是目前定位易感基因、探索遗传因素对复杂疾病影响最成功、最有效的方法。该项目以近视遗传学研究为背景以及突破点,以全基因组概括关联统计量为数据驱动,开展统计方法学、应用研究。在方法学研究方面,该项目主要贡献有:第一,解决了多性状关联分析领域的解释性难题,并回答了国际著名遗传统计学家、哈佛大学H.Aschard教授提出的“PCA方法在处理高维多性状关联分析时会损失功效”的问题;第二,提出了一种新的基于有偏概括关联统计量的二元关联分析,并应用所提出的二元关联分析方法去分析人体性状遗传研究概括关联统计量,发现了8个新的易感基因。在数据库构建方面,项目组完成了两个重要概括关联统计量数据库的搭建:第一,申请加入了国际近视基因组研究最权威的研究联盟: CREAM(Consortium for Refractive Error and Myopia), 并依托CREAM收集到了将近3万个样本的与近视相关的全基因组概括关联统计量;第二,完成了UKBiobank数据库的申请、数据下载与清理。在应用方面,参与设计了从多性状关联分析角度分析角膜曲率的全基因组关联分析策略,并参与完成上国际上规模最大的角膜曲率全基因组关联分析研究,发现了47个与近视相关的基因;完成了多个临床预测模型的构建,包括心脏瓣膜手术风险预测模型、新冠病人高风险人群预测模型。依托该项目提供的丰富的数据、研究问题,以及科研经费,共发表了高水平学术论文4篇,其中包括:2篇发表在遗传统计学领域权威期刊Genetic Epidemiology,Frontiers in Genetics上,一篇发表在综合性权威杂志Communication Biology(影响因子6.3);共培养了博士研究生1名,硕士研究生9名,1名参与项目的本科生被美国哈佛大学录取。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
全基因组关联分析中基因-基因交互网络比较的统计推断方法研究
基于基因水平的全基因组关联研究统计方法研究
基于疾病数量表型观和潜变量理论的全基因组区域化关联分析统计推断方法研究
基于排序集抽样及其推广取样方法上的次序统计量以及统计推断