Current genetic association analysis focuses mainly on common variants with large frequencies. There are many evidences showing that common variants can only explain a small proportion of the variability of common diseases or traits. Therefore association analysis of rare variants may lead to deeper understanding of complex diseases and is important to diagnosis and treatment of common complex diseases. With the next-generation sequencing technology which can measure many more low-frequency rare variants, medical and biological researchers are switching from studies of common variants to analysis of rare variants in genome-wide association studies. A single rare variant has little information when sample size is not very large since it cannot be observed frequently in human genome, and therefore the traditional association tests that designed for common variants may not be powerful for analyzing rare variants. We will study new statistical testing methods for rare variants by aggregating several rare alleles in the same functional region for case-control design, trio design and other family designs. We propose to aggregate rare variants by adding constraints on the effects of rare variants in the framework of fixed-effect regression models and assuming randomness of the effects in mixed-effect models, the resulting tests are called burden-type tests and C-alpha-type tests respectively in the literature. Our method may be easily be applied to the genome-wide association studies.
目前的基因关联分析主要研究频率较大的普通变异, 但有证据表明全基因组关联分析所发现的普通变异只能解释疾病很小部分的可遗传性,因此寻找和发现与常见疾病关联的重要稀有变异,对于理解人类复杂疾病的遗传机制和疾病的诊断及治疗有重要的意义。新一代DNA测序技术可以测量得到越来越多的稀有基因变异或低频率等位基因,使得稀有变异的全基因组关联分析成为可能。在样本量有限的前提之下,稀有变异由于频率较低而所含的信息量很少,因而传统的统计检验方法用于分析稀有变异时会功效偏低。本项目主要针对稀有变异的低频稀疏特点,研究群体病例-对照设计、三元核心家系和一般家系设计下的稀有变异关联分析方法。在固定效应或混合效应回归模型框架下,通过对稀有变量回归系数进行约束或假设效应的随机性,对多个稀有变异进行有效的整合或集成,得到负荷类型或其它类型的检验方法。本项目所研究的方法将应用于全基因组实际数据的关联分析。
本项目研究基因组关联分析中稀有变异的统计分析方法。因为普通变异只能解释疾病很小部分的可遗传性,因此寻找和发现与常见疾病关联的稀有变异,对于理解人类复杂疾病的遗传机制和疾病的诊断及治疗有重要的意义, 而新一代DNA测序技术为稀有基因变异的研究提供了可能。在样本量有限的前提之下,稀有变异由于频率较低而所含的信息量很少,因而传统的统计检验方法用于稀有变异分析时会功效偏低。本项目主要研究了(1)病例对照设计和家系设计下稀有变异的加权平均负荷检验和惩罚估计方法,得到了具有较高功效的检验方法;(2)研究了线性和非线性随机效应模型中随机效应的两步估计方法,提出了经验贝叶斯估计的偏差校正和快速计算方法;(3) 研究了多变量线性混合效应模型的范数惩罚方法(APML0),该方法可以同时分析上万个普通和稀有SNP变量,计算效率高并可应用于全基因组多变量关联分析;(4)研究了稀有互斥基因的检测方法,通过逐步合并的方式得到了贪心算法FSME和GAME,所提方法计算高效且具有较高的准确度以及较低的假阳率;(5) 研究了基于信号处理理论中的压缩感知方法在单体型估计中的应用,得到的CHAP方法能达到目前流行软件的精确度,且在计算效率上有大幅度的提高(提高了2-3个数量级)。本项目共发表和已接受受本项目支持的标注论文13篇(一篇已接受),2篇未标注但接受本项目支持的论文以及1篇会议论文。发表在Briefings in Bioinformatics, Bioinformatics,Statistical Methods in Medical Research, Biostatistics等杂志上。本项目的研究工作以方法研究为主,但都通过了实际数据实证分析,其中多数论文都提供了软件供用户下载,所提出的方法具有应用前景,为生物医学研究提供了有用的工具。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
家畜全基因组分析中稀有变异上位效应检测方法与应用研究
三元家系设计中稀有基因变异的统计方法研究
基于基因集富集分析的奶牛全基因组关联分析方法及其应用研究
稀有突变和复杂疾病遗传关联的贝叶斯方法的研究和应用