Bayesian methods provide a powerful framework to estimate species divergence times by combining information from molecular sequences with information from the fossil record. With the explosive increase of genomic data, divergence time estimation increasingly uses data of multiple loci (genes or site partitions). Widely used computer programs to estimate divergence times involve a number of inadequacies.that may lead to poor time estimates. In this project, we will study Bayesian methods and models for estimating divergence times under relaxed-clock models which integrate genomics data with fossil information. By investigating the impact of the rate prior and the uncertainty of fossil calibrations, we will identify reasonable rate prior so that the posterior time estimation is robust to prior misspecification. By studying the effect of partitioning and evaluating different partition strategies, we will find the efficient way of partitioning genome data. We will also develop models of morphological trait evolution which will allow us to incorporate morphological and molecular data in a combined analysis,.leading to accurate posterior time estimation. The new models and methods will be implemented in the computer program MCMCTree.
贝叶斯方法是综合分子序列信息和化石信息来进行物种分化时间估计的强有力的工具。随着基因组数据的爆炸性增长,科学家们需要使用多位点数据进行物种分化时间的估计。但是目前常用的物种分化时间估计的模型和算法尚存在严重问题。本项目将在贝叶斯框架下,研究在宽松分子钟模型下使用化石信息来分析基因组数据以估计物种分化时间的方法和模型。通过研究核苷酸替代速率先验和化石不确定性对后验时间估计的影响,来寻求更加合理的先验设置方法;通过研究数据划分策略对后验时间估计值的影响来评估不同的划分策略,探索最高效的使用基因组数据的方法;建立形态性状进化的模型,联合分析分子和形态数据以估计物种分化时间。通过以上研究改进和完善MCMCTree软件,为用户提供准确、高效、可靠、可用于分析大规模基因组数据的物种分化时间估计软件。
基因组数据的存在使得我们能够准确的估计进化距离,它是进化速率和分化时间的乘积。但是分子数据并没有分别提供进化速率和分化时间的信息,需要借助化石、先验等外在信息来对物种分化时间进行估计。由于进化速率和分化时间的不可识别性,贝叶斯物种分化时间估计并不是一个通常意义下的贝叶斯估计问题,因而一直是基因组数据分析的热点和难点。本项目研究了在贝叶斯框架下、宽松分子钟模型下,通过使用化石信息分析基因组数据以估计物种分化时间的方法和模型。. 我们研究了贝叶斯物种分化时间估计的模型和理论,主要集中于核苷酸替代速率先验和化石先验对物种分化时间的影响,以及数据划分策略对后验物种分化时间估计的准确性和精确性的影响,通过以上研究改进和完善MCMCTree软件。与南京师范大学、中山大学合作,使用基因组数据对绿色植物和角蟾进行了物种分化时间估计,并对相应的进化历史进行了推断。通过对模拟数据和真实数据的分析,我们比较了综合分析(tip dating)和现有分析方法(node dating)的分析结果,并指出了综合分析模型存在的问题。我们还研究了贝叶斯模型选择的渐近理论,指出了当比较模型相同错误且极限模型相同时,贝叶斯模型选择呈现病态的渐近行为,并提出了使用基于Bootstrap模型选择方法来解决这一问题。. 在基金执行期间,项目负责人以通讯作者发表在中国科学发表论文一篇,并列通讯作者在领域内旗舰期刊Systematic Biology发表论文一篇,共同第一作者在Systematic Biology和PNAS上各发表了一篇论文。另有三篇论文发表在MBE,Systematic Biology和MPE上。此外还编写了教材《The Molecular Evolutionary Clock》的第六章《Bayesian Molecular Dating》(Springer, 2020)。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
连续时间金融模型的贝叶斯分析
利用贝叶斯方法估计LAMOST恒星参数
基于贝叶斯估计的RC框架结构地震损伤概率识别方法改进与验证
Errors-In-Variables模型的贝叶斯估计理论研究