基于单体型的基因统计关联分析

基本信息
批准号:11271346
项目类别:面上项目
资助金额:60.00
负责人:杨亚宁
学科分类:
依托单位:中国科学技术大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:韦来生,袁敏,侯波,方红燕,潘小青,刘庆,王琦,邢昕,王惟
关键词:
交互作用单体型复杂疾病关联分析
结项摘要

Genetic association analysis aims at uncovering the differential pattern or distribution of genetic components between cases and controls for complex diseases. A haplotype is a sequence of alleles on the same chromosome, which is regarded as linkage disequilibrium(LD) information-rich carrier and an effective tool to study gene-gene interaction. Genotype data do not provide phase information and haplotypes are not observable, therefore genotype data are incomplete when haplotypes are the unit of the study. We propose to investigate haplotype-based association analysis methods, expecting that haplotypes as the unit of association analysis can provide insightful information about multi-gene interactions. We will study the regularization approach in compressive sensing theory to estimate haplotype frequencies, based on the fact that the existing haplotypes in population are rare; By contrasting the eigen-vectors and eigen-values of the LD matrices or composite LD matrices, we explore the interaction pattern in multi-locus analysis; By applying the combinatorial partitioning methods for retrospective likelihood function, we investigate the method of collapsing haplotypes to improve power of genotype-based association analysis; The next-generation sequencing method have provided much more common and rare genetic variants than ever before, we will study Bayesian approach and methods based on haplotypes composed by rare variants to ensemble small or moderate effects of multiple rare variants.?The methods developed in this project can be readily applied to genome-wide association analysis for complex diseases.

复杂疾病的基因关联分析关键在于寻找和发现多个基因在病例和正常人之间统计分布的不同。单体型作为同一条染色体上不同位点的等位基因组成的序列,是基因位点之间连锁不平衡(LD)或相依信息的有效载体,其分布在病例与对照组之间的差异反映了多个等位基因对于疾病的共同作用。基因型数据不提供单体型的相型信息,因而基因型数据的单体型分析是一种不完全数据的统计分析方法。本项目研究以单体型为基本单位的基因关联分析,包括利用群体中单体型的稀疏性研究单体型频率估计的压缩感知规则化算法;基于LD系数矩阵或复合LD系数矩阵主要特征在病例组和对照组之间的差异,构建交互作用分析方法;基于回溯型似然函数,通过组合划分方法降低参数空间维数,研究以单体型为基础的高效检验方法;利用下一代测序技术提供的大量低频率变异,研究贝叶斯方法以及单体型方法整合多个稀有变异的效应。本项目所研究的方法可应用于复杂疾病的全基因组多基因关联分析。

项目摘要

本项目研究复杂疾病基于单体型的基因关联分析。复杂疾病与多个基因和环境因素有关,发现关联基因及其交互作用对于复杂疾病的遗传机理分析有重要的意义。项目主要研究内容包括稀有变异的关联性检验,基于新一代测序的癌症驱动基因检测和通路分析,单体型频率的压缩感知估计,三元核心家系数据的稳健TDT检验以及药物动力学的经验Bayes协变量分析方法和Bayes统计分析的理论研究等内容。..在自然科学基金的支持下,我们在生物信息和基因流行病学等方面的研究中取得了一些有意义的研究成果和若干进展,发表标注论文18篇(其中15篇SCI)。主要成果如下:稀有变异的关联分析是当前全基因组研究中的热点问题,关联稀有变异的发现能够显著地提高遗传因素所能解释的人类性状变差的百分比。我们提出并研究了基于泊松逼近的统计检验方法、基于相对风险的变阈值合并方法以及基于似然比检验的变量选择方法; 关于单体型的频率估计我们采用压缩感知领域的L1惩罚方法,得到了一种不同于以往基于似然理论的估计方法,该方法所使用的采样矩阵非随机,是对压缩感知采样理论的一个有益补充;关于癌症的驱动基因研究,基于癌症患者群体的异质性,我们建立混合模型并同时考虑多种变异类型,应用似然方法研究了癌细胞驱动基因和通路分析,所得到的似然比检验和计算方法形成了软件DrGap;关于药物动力学中的协变量分析,我们研究了经验Bayes估计的压缩性质和似然比检验的性质,并研究了部分有界响应变量取值于边界情形下统计指标的制定方法及其性质。模拟分析和实际数据分析验证了所提方法的有效性和计算实用性,部分研究结果可应用于复杂疾病的全基因组关联分析。通过本项目的实施,培养博士生5人(毕业2人),硕士生11人(毕业8人)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

杨亚宁的其他基金

批准号:10671189
批准年份:2006
资助金额:23.00
项目类别:面上项目
批准号:10971210
批准年份:2009
资助金额:24.00
项目类别:面上项目
批准号:11671375
批准年份:2016
资助金额:48.00
项目类别:面上项目

相似国自然基金

1

复杂疾病的单体型关联分析方法

批准号:10901031
批准年份:2009
负责人:郭伟
学科分类:A0403
资助金额:16.00
项目类别:青年科学基金项目
2

基于全基因组概括关联统计量的统计建模与推断

批准号:11771463
批准年份:2017
负责人:郭小波
学科分类:A0403
资助金额:48.00
项目类别:面上项目
3

基于单体型或高维SNPs基因整体效应的潜在结构关联模型研究

批准号:31071156
批准年份:2010
负责人:张岩波
学科分类:C0609
资助金额:8.00
项目类别:面上项目
4

基于基因水平的全基因组关联研究统计方法研究

批准号:81202283
批准年份:2012
负责人:易洪刚
学科分类:H3011
资助金额:23.00
项目类别:青年科学基金项目