Whether gene flow exists during speciation is one of the hottest topic and most difficult issues in population genetics. We suggest to develop an isolation-with-migration (I-M) model involving three or more species. We use Markov processes to model the genealogical process. The model is used to construct a likelihood ration test.Compared with models for only two species, an out-group species is used to provide further information concerning gene trees and model parameters. This helps to decrease the error of parameter estimation and power of the test. The model is implemented in the likelihood framework for analyzing multilocus genomic sequence alignments, which makes an efficient use of information in the data. Besides,the model can be used estimate the migration rate. A program will be written to study the model. By analyzing genomics data with the model, we want to answer the following questions: what the genealogical process is exactly like; whether gene flow and recombination occured during this process and what the roles those elements play during the genealogical process. We want to develop a user-friendly software for analyzing multiple-loci sequence data from closely-related species. This research will provide valuable and significant theoretical approaches in understanding the mechanism of speciation of close-related species.
物种分化期间是否存在基因流一直是群体遗传学的一个研究热点和难点。本项目主要研究三个或以上近缘物种的隔离-移民模型。通过马氏过程来刻画由溯祖,移民等因素驱动的谱系过程。研究中采取引入外群物种的方法,从基因组数据中更多地抽取有用的信息,以克服只考虑两个物种的模型中存在的参数估计不准确,检验功效较低等缺点。我们在似然函数框架下建立模型,能够分析较多位点数据,弥补了移民模型的MCMC 方法无法分析多个位点的大数据的缺憾。此外模型还可用于估计移民率。根据模型构造似然比检验并设计算法、编写程序来分析模型。通过用模型分析基因组数据来回答下列问题:物种形成模式是怎样的;物种形成过程中是否存在基因流、基因重组等因素;这些因素在成种过程中的角色与作用如何。最后设计一个简单易用的用于分析近缘物种序列的软件包。这一研究将对从基因组层面推断近缘物种成种机制提供有价值的理论方法与实证。
基因流是一个非常重要的生物过程,直接影响我们对种内和种间基因组数据的解读。目前可用于检测基因流的方法包括简单统计方法、基于MCMC算法的方法和基于全似然方法。简单统计方法缺乏数学模型的支撑,基于MCMC算法的方法无法用于分析基因组数据,而全似然方法目前仅被用于两个物种数据的分析。基于此,我们在极大似然框架下研究了移民率(基因流)估计的问题。. 我们通过建立基于马氏过程的隔离-移民模型来刻画物种的系谱过程,并根据模型设计似然比检验,通过计算机程序来实现似然函数的计算。最终设计一个人性化的、可在不同模型下快速分析基因组数据的软件包3s。3s软件能够支持多元化的数据结构、考虑不对称移民等复杂结构化溯祖模型,并进行包括基因流强度在内的成种过程参数估计。由于3s软件的使用需要用户提供物种树,所以我们还花费了一些精力研究了基于多物种溯祖模型的物种分化时间估计问题。具体研究内容包括贝叶斯物种分化时间估计问题中速率先验对时间后验估计的影响和宽松分子钟下后验时间估计不确定性的来源并定量的分析了各成分的影响。. 三个物种隔离-移民模型的相关工作,2016年已在Systematic Biology杂志上在线发表,并同时发布了3s软件。该软件能够迅速分析基因组数据、检测基因流模式、估计成种过程中相关参数。在文章中我们还分析了三个果蝇物种的数据,分析结果揭示存在D. simulans 到 D. melanogaster的基因流,而不存在反向基因流,基因流强度约为0.02个个体/代。在贝叶斯物种分化时间估计问题方面,我们发现之前唯一被使用的进化速率先验(位点间独立同分布的速率先验)会导致后验时间估计对先验参数异常敏感等问题,并提出了使用复合狄利克雷先验代替位点间独立同分布先验。组合狄利克雷先验现已被用作为MCMCTree软件最新版本v4.8的缺省先验。该工作2014年发表在Systematic Biology杂志上。我们还分析了宽松分子钟下使用多位点数据时后验不确定性的来源并定量的分析了它们的影响,称之为“有限位点理论”。研究指出,即使数据量趋于无穷,带有化石校准的物种分化时间估计后验不确定性依然存在。提高估计精度的首要途径是增加校准化石及提高化石的精度,并建议通过测量多基因数据来提高估计的精度。该工作2015年发表在Systematic Biology杂志上。
{{i.achievement_title}}
数据更新时间:2023-05-31
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
气载放射性碘采样测量方法研究进展
基于全模式全聚焦方法的裂纹超声成像定量检测
基于混合优化方法的大口径主镜设计
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
红树科的分子进化及最大似然模型与程序研究
基于最大似然原理的分层聚类算法研究
基于最大似然直线匹配的遥感影像配准方法研究
改进最大似然译码错误概率上界的新方法研究