It has been a long-term important and essential question in population genetic studies to infer population history and detect natural selection using genetic polymorphism. The piling up of whole-genome sequencing data for large numbers of individuals has opened a new door to addressing questions beyond the scale of small data sets. On the other hand, the existing population genetic methods cannot be directly applied to the large-scale genomic data because of the intensive computation or severe numerical issues incurred by large sample size. The proposed research is focused on developing computationally efficient methods for inference of important evolutionary processes that are estimable only with large whole genome data sets. There are two main aims for this proposal. First, we will develop analytical theory for the large-sample joint allele frequency spectrum using coalescent theory. Second, we will detect natural selection acting on the haplotype structure around the vicinity of the selected mutant by hidden Markov models. Under each aim, we will develop novel theories as well as likelihood-based computational methods, to provide the research community with useful tools for the analysis of the large-scale genomic data.
利用遗传多态性来推断群体历史和检测自然选择是群体遗传学一直以来的研究重点和核心问题。近年来随着测序技术的发展,个体基因组数据迅速增加,为群体遗传学对进化过程中这些重要问题的研究提供了前所未有的契机。同时,现有的群体遗传学方法在分析基因组大数据时,面临计算量太大或者计算数值溢出的问题,因此需要新的理论和方法来研究分析这些大数据。本项目专注于面向大规模个体基因组数据,发展能有效地进行群体遗传学分析的方法。我们将以溯祖理论为框架,构建多群体在大样本时候的联合等位基因频谱;以隐性马尔科夫链模型为基础,模拟在自然选择条件下的复杂单倍型结构。我们在理论追求创新性的基础上,设计高效准确的计算与统计方法,以有效地利用基因组信息,为基因组大数据时代的遗传学研究提供有价值的方法和软件包工具。
利用遗传多态性来推断群体历史和检测自然选择是群体遗传学一直以来的研究重点和核心问题。近年来随着测序技术的发展,个体基因组数据迅速增加,为群体遗传学对进化过程中这些重要问题的研究提供了前所未有的契机。同时,现有的群体遗传学方法在分析基因组大数据时,面临计算量太大或者计算数值溢出的问题,因此需要新的理论和方法来研究分析这些大数据。本项目专注于面向大规模个体基因组数据,开展了以下几个方面的群体遗传学理论和方法学方面的研究。我们首先以溯祖理论为框架,构建了在大样本条件下,单群体的等位基因频谱以及多群体的联合等位基因频谱的解析形式;我们进而针对某些特殊群体历史下无法得到等位基因频谱的解析形式的情况,发展了一个计算高效的方法,用于实现任意群体历史下的等位基因频谱的构建。在此基础上,我们开发了通过基因组数据来推断群体历史的分析方法FINCH。在自然选择的检测方法方面,我们基于多个群体的联合等位基因频率以及环境变量,开发了用于检测环境适应性进化的方法MEMEA;基于单倍型结构,发展了检测软性选择的分析方法。这些高效准确的方法为基于大样本数据的群体基因组学研究提供有效的分析方法和工具。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
地震作用下岩羊村滑坡稳定性与失稳机制研究
湖北某地新生儿神经管畸形的病例对照研究
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
山核桃赤霉素氧化酶基因CcGA3ox 的克隆和功能分析
微进化机制中群体基因组数据分析的新方法研究
面向大数据的群体偏好决策分析研究
面向癌症基因组图谱数据分析的稀疏矩阵分解方法研究
整合遗传学与基因组学信息的全基因组测序数据分析方法