The abundance of spliceosomal introns differs significantly among eukaryotic lineages, as well as among different genes within the same species. However, there are still many controversies on the evolutionary forces that shape the current distribution pattern. In the past evolutionary studies, researchers mainly concerned the two supergroups (Opisthokonta and Archaeplastida), the other three supergroups were relatively fewer. The unbalanced research would certainly go against comprehensive understanding of the evolution of eukaryotes. In addition, the phylogenetically independent contrasts (PIC) method were rarely used for intron evolution studies, which likely resulted in false-positive results. One possible reason for rarely use is that the coverage of high-quality genome data is not enough in phylogenetic tree of eukaryotes, it is not conducive to PIC method. This project benefits from rapidly increasing of genome sequencing data in recent years, we will study on the representative species of all the five eukaryotic supergroups. Based on the comparative genomics analysis of multiple species, exploring eukaryotic intron variation, and evaluating the existing models of intron losses/gains, and whether it is universal in the evolution of eukaryotes. We are also planning to use PIC techniques to examine the relationship between intron density and intron distribution, and the relationship among the rates of intron loss and selective pressures, effective population sizes, genome sizes, then trying to discover the mechanisms of intron evolution.
内含子在不同真核生物间以及同一生物的不同基因之间分布差异较大,造成这种现象的进化原因仍存在较大争议。以往的进化研究以Opisthokonta和Archaeplastida两大类群模式物种为主,其他三大类相对较少,不利于全面了解真核生物的进化过程。另外,系统发育独立比较(PIC)方法在内含子进化研究中使用较少,研究结果假阳性的可能性高。之前,内含子进化研究领域很少使用PIC方法,一个可能是因为之前高质量测序数据在真核生物系统发育树上的覆盖度不够,不利于PIC方法的开展。得益于近几年来基因组测序数据的迅速增加,本项目将分析真核生物五大分类代表物种,基于多物种比较分析,发掘真核生物内含子变异特征,评估现有内含子丢失和获得模型在真核生物进化过程中是否具有普遍性。采用PIC方法分析进化过程中内含子密度与内含子分布的关系,内含子丢失频率与选择压力、有效种群、基因组大小的相关性,探索内含子的进化机制。
遗传变异是生物进化的基础,研究基因序列的变化有助于认识和掌握生物进化规律。真核生物的基因组变异可以根据变异的长短,分为单核苷酸多态性、短片段插入和缺失、与染色体结构变异等;也可以根据变异的位置分为编码序列变异和非编码序列变异(如内含子变异)。在本项目支持下,从以下几个方面开展了多物种序列比较相关研究。.(1)基于104种线虫基因组比较,成功构建了线虫纲的分子进化树,运用PIC方法和传统分析手段,对内含子的密度、长度、位置等特征进行分析,综合考察评估了内含子进化模型。对线虫属的内含子丢失和获得机制进行深入研究,验证了内含子丢失在生物进化中的重要地位,证明了线虫的内含子丢失机制仍以cDNA介导的反转录模型为主,与大多数真核生物类似,更正了之前的研究结果,完善了真核生物内含子丢失机制的研究。.(2)通过对基因组大小差异较大的近缘物种基因组分析,在食虫植物中发现基因组缩小的选择压力可能与内含子丢失有关,内含子丢失所在基因以及附近位点的突变率更高、受到选择压力更强;而且丢失数量多的物种其突变率也更高、受到选择压力更强。检验了突变风险假说,丰富了真核生物基因组进化动力的理论体系。.(3)通过分析秀丽隐杆线虫中内含子丢失与操纵子的关系以及内含子丢失的动态变化。发现内含子丢失所在基因更容易出现操纵子,而且进入快速生长期后内含子丢失基因的表达量显著高于其他基因,并且随着时间的推移,丢失基因的表达量与其他基因的表达量呈现负相关。我们认为内含子丢失通过节约转录资源,促进了基因的快速表达和生物体的生长发育。.(4)人类致病变异在基因组上分布模型。发现了致病SNP更容易发生在基因的编码序列,和导致编码信息改变的非编码区域;变异位点与编码序列一级结构无关,而与蛋白质的高级结构有关。相反,良性变异倾向于发生在对蛋白质序列或结构影响较小的区域。为初步识别人类基因组致病变异和良性变异、评估基因组变异引发疾病危险性等提供一些基础支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
黑河上游森林生态系统植物水分来源
青藏高原--现代生物多样性形成的演化枢纽
不同湿地植物配置对扑草净的吸收和去除效果研究
住区生物滞留设施土壤生境与种植策略研究
植物中蛋白质S-酰化修饰的研究进展
近缘物种间和物种内内含子数目变异的进化机制
基因组大小与内含子进化的比较研究
基于物种进化和知识共享的智能进化计算
基于蛔科多物种比较基因组分析的程序性DNA消除研究