The analysis of high-dimensional data, especially high-dimensional genetic data, has been one of hot topics in the research fields of statistics. Moreover, we still need to consider the interactions among variables in many practical problems. For example, most of human complex disorders can be caused by the interactions among genes as well as by the interactions between genes and environmental factors. The study of these interactions is becoming more and more important in the analysis of high-dimensional genetic data. But at the same time, the curse of dimensionality presents a challenge to the statistical modeling of the interactions. In this project, driven by high-dimensional genetic data and the research problems in the analysis of complex disease association studies, based on the existing statistical theories and approaches, for the purpose of application, we will propose some statistical methods for identifying interactions in the analysis of high-dimensional genetic data, study the interactions among genes as well as the interactions between genes and environmental factors, and discover some suspected genetic loci that have interaction effects on the disease of interest. The study of this project is not only of practical significance to the prevention and treatment of human complex disorders as well as to the development of gene drug, but also has the scientific research value to the approach development of statistics and its applications in the related areas.
对高维数据特别是高维遗传数据的分析是近年来统计学研究的热点问题之一。然而,许多实际问题还需要我们进一步考虑数据中变量间的交互作用。比如,人类的复杂疾病往往是由多个基因的交互作用以及基因与环境间的交互作用共同导致。因此,在高维遗传数据分析中研究基因-基因、基因-环境间的交互作用显得越来越重要。与此同时,超高的维数也给交互作用的统计建模提出了挑战。本项目以高维遗传数据及复杂疾病基因定位问题为驱动,以现有的高维统计推断方法与理论为基础,以实际应用为目的,发展适用于高维数据特别是高维遗传数据变量间交互作用的统计推断方法,研究基因-基因、基因-环境间的交互作用,寻找对复杂疾病有交互作用影响的疑似遗传位点。本项目的研究不仅对人类复杂疾病的治疗与预防、基因药物的研发有着非常重要的实际意义,还对统计学本身的发展以及其在相关领域的应用有更为重要的科学研究价值。
对高维数据特别是高维遗传数据的研究是近年来统计学研究的热点问题。人类的复杂疾病通常是由多个基因的交互作用以及基因与环境间的交互作用共同导致的,这就需要在高维遗传数据的统计分析中研究基因-基因、基因-环境间的交互作用。与此同时,遗传数据超高的维数也给交互作用的统计建模提出了新的挑战。本项目以高维遗传数据及复杂疾病基因定位问题为驱动,以现有的高维统计推断方法与理论为基础,以实际应用为目的,发展了适用于高维遗传数据变量间交互作用的统计推断方法,研究了基因-基因、基因-环境间的交互作用。我们具体研究了以下几部分内容:1)交互作用的贝叶斯模型选择方法研究及其在高维遗传数据分析中的应用;2)高维数据变量间交互作用的相依多重检验方法及其在关联分析中的应用;3)稀有变异关联分析中基因-基因、基因-环境交互作用的代数统计方法研究;4)探测处理变量与其他协变量交互作用的最优个体化治疗方案研究;5)基于像素间相互关系及单元稀疏性先验的图像去模糊研究。针对这些研究内容,我们提出了一些新的统计理论与方法:给出了几个不同相依结构下相依多重检验的FDR控制过程,提出了基于列联表的稀有变异关联分析检验的代数统计方法,建立了带有交互作用的高维统计模型的变量选择的贝叶斯理论与方法,构造了探测处理变量与其他协变量交互作用的最优个体化治疗方案的统计模型,发展了一系列图像去模糊中的优化算法。基于上述研究结果,我们撰写了一系列高质量的学术论文,大部分的论文已经正式发表,还有一部分已投稿或正在准备投稿之中。我们提出的新方法不仅在统计上有一定的理论研究价值,还可以被广泛应用到高维遗传数据的统计分析中。本项目的完成不仅对人类复杂疾病的治疗与预防、基因药物的研发有着非常重要的实际意义,还对统计学本身的发展以及其在相关交叉领域的应用有更为重要的科学研究价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
高维数据下多因变量回归模型的统计推断
带潜变量高维模型的统计推断
高维数据变量间非线性交互作用的研究
高维数据的图模型学习与统计推断