About 25% of proteins encoded by the eukaryotic genomes contain repetitive sequences. Repetitive sequences are the major components of some structural proteins or protein functional domains, and have been proven to possess many important functions. However, previous studies on repetitive sequences mainly focused on those comprising known functional domains, little attention has been paid on the uncharacterized protein repeats, and studies about the effects of repetitive sequence emergence and variation on the microevolution of protein functions are particularly lacking. Our preliminary studies have found many uncharacterized repetitive sequences in eukaryotic proteins, and some repeats also exhibited variations among homologous proteins of closely related species. In this project, we plan to systematically screen for repetitive sequences, especially uncharacterized repetitive sequences outside of known functional repeats, among the proteins of 10 animal species, with lower to higher species complexity. Systematic analysis will be carried out to analyze the composition, distribution, structural, functional and evolutionary features of the identified repetitive sequences. In combination with wet-lab experiments, we will explore whether the emergence and variation of repetitive sequences will affect the microevolution of protein functions. Accomplishment of this project will shed new light on the study of functional elements within proteins as well as their evolution. A public database with all information about repetitive sequences obtained from this project will be constructed to facilitate the studies on repetitive sequences of other researchers.
真核生物中约有25%左右的蛋白质包含重复序列。重复序列是一些结构蛋白和蛋白功能域的重要组成部分,已被证实具有多种重要功能。但以往关于重复序列的研究主要针对组成已知蛋白功能域的重复序列,而对尚未识别的重复序列关注较少,尤其缺少关于重复序列的出现与变异对于蛋白质功能进化影响的研究。我们的前期研究工作已经发现真核生物蛋白质组中存在很多未被识别的重复序列,并且一些重复序列在近缘物种的同源蛋白间存在差异。本项目拟以10种低等到高等动物蛋白质组为对象,系统发现其中的重复序列,尤其是已知蛋白功能域外的重复序列,开展重复序列的组成、分布、结构、功能与进化特征的系统研究,并结合实验,探索重复序列的出现与变异是否对蛋白质功能的进化产生影响。项目的顺利完成有望为解析蛋白功能的决定元件与进化提供新的思路。项目还将建立数据库公布研究发现的重复序列信息,以方便其他科研人员开展相关研究工作。
真核生物中约有25%左右的蛋白质包含重复序列。重复序列是一些结构蛋白和蛋白功能域的重要组成部分,已被证实具有多种重要功能。但以往关于重复序列的研究主要针对组成已知蛋白功能域的重复序列,而对尚未识别的重复序列关注较少,尤其缺少关于重复序列的出现与变异对于蛋白质功能进化影响的研究。本项目利用以低等到高等动物蛋白质组为对象,开发了准确的蛋白质重复序列识别方法,对人、恒河猴、大鼠、小鼠、斑马鱼、黑腹果蝇、秀丽隐杆线虫和芽殖酵母这些在物种进化研究中具有代表性的真核生物中的蛋白质重复序列进行了系统发现,并对重复序列的特征与功能等进行了研究。发现重复序列在同一蛋白中不同重复单元间的序列高度一致,但在不同物种的同源蛋白间的长度和重复次数变化范围较大;揭示了重复序列的氨基酸组成具有一定的偏好性,一些重复序列倾向于更加频繁地使用具有强酸/碱性、强疏水性、和翻译后修饰位点的氨基酸,表明它们可能参与和其它分子的特殊的相互作用。进化分析发现人和灵长类动物间的重复序列大多保守。在功能上,含重复序列的蛋白大多具有与其它蛋白或化合物结合的能力,并倾向于与其他功能域存在于同一蛋白中。为方便研究人员对含有重复序列的蛋白质进行浏览和深入研究,我们构建了蛋白质重复序列数据库。并在此基础上,对可能通过序列重复扩增而导致疾病的蛋白质进行了分析和预测,构建了人类疾病相关的重复序列数据库。这些成果为研究人员全面认识蛋白质中的重复序列及其功能,并开展深入研究奠定了基础。蛋白质的相变过程参与很多重要的生理病理调控,正成为蛋白质研究领域的新兴前沿,很多重复序列在蛋白质相变过程发挥重要功能,本项目的研究结果也对于发现具有相变形式的蛋白质具有较好的参考价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
真核生物基因及其编码蛋白的信息基础
真核生物mRNA 3'末端poly(A)前非模板核苷酸序列信息的发现、形成机制及功能研究
真核生物mRNA poly(A)结合蛋白(PABP)功能及调控研究
肌动蛋白与真核生物进化的研究