复杂疾病非线性基因效应探测的高维统计推断模型研究

基本信息

批准号：81872717

项目类别：面上项目

资助金额：54.00

负责人：杨海涛

学科分类：

依托单位：河北医科大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：李少玉,高霞,闫丽娜,冯彦成,郭志旺,秦璞

关键词：

高维统计推断统计遗传学核方法复杂疾病全基因组关联分析

结项摘要

Genome-wide association studies have identified numerous genetic variants associated with complex disease. However, these variants can only explain a small portion of heritability in many diseases. Gene-based association methods have been proved to be alternative strategies to capture some missing heritability, but the majority of these methods are based on linear model and cannot be generalized to high-dimensional data. Recent advances in high-dimensional model development have been shifted from high-dimensional variable selection to high-dimensional statistical inference. While most inference procedures are still built upon linear models, they fail to capture any potential nonlinear relationship. Moreover, these models have limited power to detect weak genetic signals. Our previous study revealed that a composite kernel can substantially improve the performance of dealing with nonlinear problems, and a maximum statistic method distribution and a p-value combination method can respectively improve the power of two genetic effect hypotheses which are main loci determinism and loci micro effect accumulation theory. Motivated by this, in this project we propose to construct a gene-based nonlinear high-dimensional statistical inference procedure that can be adaptive to the two genetic effect hypotheses by combing the composite kernel idea, linear high-dimensional statistical inference procedure and Omnibus Test, to improve the power of detecting genetic variants, and to provide a novel statistical framework for the study of genetic mechanism underlying complex human diseases.

目前全基因组关联分析已找到了大量复杂疾病相关遗传变异，但这些变异只能解释很小一部分遗传力。基于基因的方法被认为可以弥补一些缺失的遗传力，但这些方法大多基于线性模型，也无法拓展到高维数据上。近年来高维统计模型的开发已从高维变量筛选发展到高维统计推断，但大多仍为线性模型，无法捕捉遗传变异与复杂疾病间的非线性关系，且对微效变异的探测能力不高。我们前期研究发现应用复合核（Composite kernel）可以提高核方法处理非线性问题的能力，也发现“最大统计量”分布和合并p值方法可以分别提高两种遗传效应假设（主要位点决定论和位点微效累加论）的检验效能。本项目将联合应用复合核方法、线性高维统计推断模型以及混合检验（Omnibus Test）方法，构建能够自适应两种遗传效应假设的基于基因的非线性高维统计推断模型，以提高对遗传变异的探测能力，为研究复杂疾病的遗传机制提供统计学新方法。

项目摘要

传统GWAS大多是对单一SNP进行分析，所识别的易感位点只解释了复杂疾病中一小部分的遗传力。若能同时考虑一组SNPs，那么将能够解释复杂疾病中大部分的遗传力，从而减少遗传力的缺失，即从基因水平（一组SNPs）上研究遗传变异与复杂疾病的关联可以很好地弥补传统遗传力的缺失，有助于理解复杂疾病背后的遗传学机制。目前，在探测基因对复杂疾病的效应时，通常采用的是线性模型，然而基因对复杂疾病的效应通常是未知的，而且很有可能是非线性的，因此不具备自适应不同遗传效应的线性模型的应用就有一定的局限性，且易致假阴性。本项目提出非线性基因效应探测的高维统计推断模型，基于群体关联分析原理，将线性高维统计推断模型拓展到非线性模型研究，以解决基因效应探测方法中模型假设性过强、检验效能过低等的不足。基于核方法理论、引入Omnibus Test思想，我们提出了以下的模型框架和开展了以下的工作：.1.针对基因组内超高维的SNP数据，我们提出了一个三阶段的建模框架，即第一阶段先应用变量筛选的方法将超高维数据降至高维；第二阶段应用高维统计推断方法得到每一个SNP的P值；第三阶段将SNPs映射到相应的基因，并利用Omnibus test的思想得到基因水平的P值，并实现遗传效应的自适应探测。此模型考虑以基因为单位，具备自适应不同遗传效应的能力；.2.通过引入核方法理论，构建高维数据环境下核主成分回归模型，解决了模型捕捉非线性效应的问题。.3.为了解决核主成分个数保留的问题，我们提出基于pre-image理论的核主成分个数保留技术，使模型的推断结果更加稳健。.4.为了解决ART-A中最小P值个数的选择问题，我们提出了iATR-A方法，使P值整合方法更稳健，检验效能更高。.5.通过大量的模拟证实了模型对线性和非线性效应的探测能力，对其有效性和实用性进行评价，相关计算程序采用R语言编写，可以广泛推广。.6.应用于阿尔兹海默症SNP数据，通过实际数据分析来验证模型的实证性。.我们开发的方法和程序为复杂疾病的基因诊断和预防以及遗传机制研究提供了研究工具与有效的方法。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：

发表时间：

DOI：

发表时间：2018

DOI：10.11842/wst.20190724002

发表时间：2020

杨海涛的其他基金

批准号：51471185

批准年份：2014

资助金额：85.00

项目类别：面上项目

批准号：30901140

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：81772204

批准年份：2017

资助金额：55.00

项目类别：面上项目

批准号：49304049

批准年份：1993

资助金额：6.00

项目类别：青年科学基金项目

批准号：39300061

批准年份：1993

资助金额：4.50

项目类别：青年科学基金项目

批准号：51504231

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：31300150

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：20902039

批准年份：2009

资助金额：19.00

项目类别：青年科学基金项目

批准号：51071173

批准年份：2010

资助金额：39.00

项目类别：面上项目

批准号：11274370

批准年份：2012

资助金额：85.00

项目类别：面上项目

批准号：51771224

批准年份：2017

资助金额：62.00

项目类别：面上项目

相似国自然基金

复杂疾病关联分析中高维遗传数据的统计推断

批准号：11371083

批准年份：2013

负责人：朱文圣

学科分类：A0402

资助金额：56.00

项目类别：面上项目

带潜变量高维模型的统计推断

批准号：11901406

批准年份：2019

负责人：郭文雯

学科分类：A0402

资助金额：28.00

项目类别：青年科学基金项目

复杂数据非线性模型的统计推断及其应用

批准号：10961026

批准年份：2009

负责人：唐年胜

学科分类：A0403

资助金额：20.00

项目类别：地区科学基金项目

高维数据的图模型学习与统计推断

批准号：11201479

批准年份：2012

负责人：尹建鑫

学科分类：A0403

资助金额：22.00

项目类别：青年科学基金项目

复杂疾病非线性基因效应探测的高维统计推断模型研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

复杂系统科学研究进展

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

神经退行性疾病发病机制的研究进展

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

杨海涛的其他基金

5d金属Ir及其合金纳米颗粒、纳米线的电、磁性能研究

硫酸盐浆中残余木聚糖和木素的结构及木聚糖酶催化脱除机理的研究

寨卡病毒解旋酶移位机制的研究

地慢过渡区速度分布的理论和实验研究

人胃螺旋菌16srRNA核苷酸序列测定及其分子检测研究

锌电积用铅基合金阳极氧化层“结构-性能”优化调控基础研究

冠状病毒主蛋白酶结构的系统研究及在分类学上的应用

富勒烯参与的自由基新反应研究

磁性金属纳米颗粒的可控制备及其高频性能的研究

半金属纳米材料的自旋极化输运性能研究

Weyl半金属二维晶体材料在光、磁场下的电输运性能研究

相似国自然基金