The number of currently discovered positively selected genes in human genome is still far from explaining the difference between human and chimpanzee, in particular in intelligence, behavior, diet, etc. One possible explanation is that positive selection on regulatory regions may be the major evolutionary drive leading to the difference. So far, a number of studies have been devoted to studying the natural selection on promoter and conserved non-coding sequences. Yet, little has been done for studying the natural selection of distal-regulatory elements (DREs) that play essential roles in regulating many cellular processes. This is because, on the one hand, the complete annotation of DREs is still lacking; on the other hand, the target genes of most DREs are unknown, making it difficult to interpret the biological meaning of the natural selection. Because DREs tend to be located in open chromatin structure, which is sensitive to DNAse1, in this proposal, we will use the most recently published DNAse1-seq data to annotate DREs in genome scale. Considering that the regulatory relationship between DREs and target genes should be conserved across genomes, we will develop a phylogenetic profile-based method to predict the target genes of DREs. Finally, we will combine the analysis of DREs with accelerated evolution rate with the functional analysis of the predicted target genes to identify DREs under positive selection. This study will provide new insights on how much the natural selection on regulatory regions may have contributed to the evolutionary difference between species.
目前在人基因组中发现的正选择基因的数目尚不足以完全解释人和类人猿在智力、行为和饮食等方面的差异。一种可能的解释是调控区域的自然选择可能是推动物种特异性的主要作用力。现在已有一些启动子区域及保守非编码区域进化选择的研究,但对于在真核生物基因转录调控中起重要作用的远端调控元件的正选择研究却少有报道。这是由于一方面对远端调控元件的注释还不完全,而另一方面远端调控元件的靶基因很难确定。在本项目中,我们将从调控区域的染色体结构对DNAse1敏感这一特征,利用已发表的DNAse1-seq实验数据来注释远端调控元件。同时,基于远端调控元件和其靶基因之间的调控关系在进化上的保守性,我们将开发基于系统发生谱的方法来预测远端调控元件的靶基因。最后,我们将把有加速进化的远端调控元件和其靶基因的功能分析相结合来进行远端调控元件正选择的研究。本项目的研究将对揭示调控区域变异对物种进化的作用力有重要意义。
自然选择在人相对于其他灵长类动物的特异表型的进化过程中发挥着重要作用。鉴定在人基因组中发生自然选择的序列是进化生物学研究的一个热点问题。传统的研究集中在编码基因的正选择上,但目前所发现的受正选择的编码基因不足以解释人与其他灵长类动物的表型差异。由于基因组上调控序列上的正选择可潜在影响靶基因的基因表达,并进而影响表型的进化,因而本课题集中在人基因组中调控序列的正选择研究。人基因组的调控序列中一大部分为远程调控元件,处于基因间区域,包括增强子、绝缘子、抑制子等,可通过染色体折叠等机制来远程调控靶基因的表达。由于远程调控机制的复杂性,目前直接通过实验鉴定的远程调控元件的靶基因在文献报道中还很缺乏,给研究人基因组调控序列的进化与表型进化的关系带来困难。为此,本课题首先开发了一个生物信息学方法,通过整合系统发生谱关联性和Hi-C数据来预测人基因组中远程调控元件的靶基因。之后,本课题系统地研究了人基因组中调控序列的加速进化。通过鉴定调控序列邻近的古重复序列并假定这些古重复序列为中性进化,我们发现在人基因组中有约0.43%的调控序列发生了加速进化。对发生加速进化的调控序列进行分析,我们发现它们相对于背景调控序列更倾向于在更多细胞系中处于打开状态,并与转录活跃的表观遗传标志显著相关,表明它们倾向于处于活跃状态。对发生加速进化的调控序列的靶基因进行分析,我们发现这些靶基因倾向于富集与神经发育相关的功能,并且靶基因的表达水平在人的大脑组织中发生了明显正选择,而且这些靶基因在人的大脑组织中的表达水平要显著高于它们的直系同源基因在黑猩猩大脑组织中的表达水平。以上证据表明,人基因组的调控序列发生了正选择,并在人的特异性表型进化过程中发挥了重要作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
监管的非对称性、盈余管理模式选择与证监会执法效率?
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
代数数论
绿豆干旱胁迫应答基因及调控元件的鉴定与分析
血管生成素顺式作用元件及靶基因研究
人基因组远程调控元件的疾病表型和功能预测
基于顺式调控元件的个体化基因表达预测模型及在免疫响应中的应用