In human genome, only 2% about 20,000 genes were annotated to be coding genes that encode proteins. Are the other 98% human genome really non-coding? This is a hot question that is currently under investigation worldwide. Answer to this question may improve our understanding to the gene expression and life processes. .We proposed here a new strategy based on our established translatome sequencing analysis to provide the evidence for new proteins encoded by unknown coding genes. By comparing the translating mRNA levels in human lung cancer calls A549 and epithelial cells HBE, we have identified a new coding gene UBAP1-AST6 that may be translated to a new protein. The new coding gene UBAP1-AST6 will be cloned and expressed into a new protein; antibody will be generated against the new protein UBAP1-AST6 to validate the endogenous presence of the protein in cells and tissues. We will probe the cellular localization and biological function of the new protein UBAP1-AST6, and then investigate its molecular mechanism in tumor development and progress by using molecular and cellular biological technology. We believe that, the results derived from this project may lead to the discovery of novel proteins encoded by “non-coding genes”, providing evidences to correct the possible annotation errors in human genome and making important supplementary contributions to human proteome.
在人类基因组中,只有不到2%约两万个基因被注释为编码基因,其余98%的基因真的都不编码蛋白质?对这一问题的探索是当今蛋白质科学研究的热点之一;它的回答将加深我们对基因编码蛋白质的理解,丰富我们对生命现象的认识。本项目拟根据我们建立的翻译组测序分析所发现的翻译证据,用实验确证传统的非编码基因UBAP1-AST6可以编码新蛋白UBAP1-AST6并执行生物学功能。我们将以肺癌细胞A549为模型,根据UBAP1-AST6的翻译组数据克隆表达UBAP1-AST6蛋白,制备抗体进行内源性验证,研究其细胞定位与功能,明确其在肿瘤生物学中的作用;分析与UBAP1-AST6相互作用的蛋白质,揭示其发挥生物学功能的分子机制。该研究结果将以UBAP1-AST6的翻译证据为例,证明某些非编码基因可以编码蛋白质,发现以前从未被人们认识的与生理病理相关的新蛋白质,并可校正基因组的注释,为人类蛋白质组做出补充。
人类基因组中的编码基因约占2%,其余98%被注释为非编码基因,其中包括长链非编码RNA,均被普遍认为不编码蛋白质。但是,目前数据库中对这些lncRNA的非编码注释并不是依据实验证据,而是根据计算算法所预测,这就意味着其中有部分lncRNA的注释可能是错误的,也就是说,部分原本被人们认为不可能编码蛋白质的lncRNA实际上却可以翻译成蛋白质,并发挥功能。这些蛋白质称为“新蛋白”,是一个尚未被开发的宝库。.在本项目中,我们通过分离正在翻译中的核糖体-新生肽链复合物并测序其中的mRNA,发现有3330个lncRNA与核糖体结合且正在翻译,提示这些lncRNA可能翻译成新蛋白。接着,我们利用质谱技术、抗体技术和亚细胞定位等实验手段鉴定出了314个由lncRNA编码的新蛋白质。.同时,我们对这些新蛋白进行进一步的深入研究发现,这些新蛋白具有表达丰度较低、蛋白长度较短、等电点较高以及结构不稳定等特殊理化性质。另外,在进行物种起源与进化分析时发现,有将近一半的新蛋白质找不到其物种起源,而且,80%以上的新蛋白是由年轻的基因所编码的,甚至只有在人类物种中出现。我们提出可能正是因为新蛋白的这些特征,导致了其被错误的注释为非编码基因。.此外,我们还发现这些新蛋白大部分具有严格的亚细胞定位,提示其具有重要的生物学功能。因此,本项目聚焦于定位在细胞核和核仁中的新蛋白质UBAP1-AST6,通过采用基因敲除和过表达结合细胞生物学技术,发现过表达新蛋白UBAP1-AST6可以使细胞的增殖能力和克隆形成能力变强,而敲除新蛋白UBAP1-AST6则细胞的增殖能力和克隆形成能力变弱。进一步的研究显示,新蛋白UBAP1-AST6的表达特异地在肺癌和癌旁组织中存在明显差异,提示新蛋白UBAP1-AST6可能成为检测肺癌的新分子标志物。在接下来的分子机制研究时我们发现,新蛋白UBAP1-AST6通过泛素化降解p53蛋白从而使得细胞周期进程发生G2期加快最终导致细胞增殖变快。.总之,本项目研究结果发现了从未被人们所知道的由非编码RNA编码的新蛋白质,加深人们对lncRNA编码新蛋白的理解,不仅可以校正人类基因组的注释,为人类蛋白质组做补充,而且本项目还发现了具有重要肿瘤生物学功能的新蛋白质UBAP1-AST6,有助于从新的视角开发新的药物治疗靶点。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
编码膜蛋白的人类新基因功能研究
快速发现大鼠脑缺血预适应新相关蛋白质及其功能的研究
人类血管紧张素Ⅱ一型受体结合蛋白新基因的功能研究
肺炎链球菌新的转铁蛋白SPD_1609的发现及其功能研究