Recent years,more and more evidence reveals that short open reading frames (smORF) in long noncoding RNA (lncRNA) are translatable to produce the functional peptides (defined here as lncRNA-coded peptides), which play pivotal role in numerous cellular processes. However, numerous issues remain to be addressed as regard to structures and functions of these peptides. First, how many sORFs are actually translated? Second, how many of these peptide can be shown to be biologically active and what are their functions? Nonetheless,if there are novel or specific mechanisms for the translation of these peptides. All of these questions are remained to be explored. . In present project, we will devote to developing and optimizing approaches, integrating in silico, conservation-based prediction and a combination of genomic, proteomic and functional validation, for the profiling of lncRNA-coded peptides with high sensitivity and throughput. In addition, we will also focus our research on the construction of a database for the collection of lncRNA-coded peptides from various biological samples. Besides, a further dissection of the relationship between lncRNA-coded peptides and various cancers will be carried out. . Our results should be useful for the researches on the structure and function of lncRNA-coded peptides and offer new avenues of research into eukaryotic regulatory mechanisms.
近年来,越来越多的研究证据表明,lncRNA可以通过短的开放阅读框(smORFs)编码具有特定生物学功能的多肽(我们称之为lncRNA编码多肽)并参与不同生物学过程的调节。尽管如此,关于lncRNA编码多肽的结构与功能的研究还面临诸多的困惑和挑战。诸如究竟有多少lncRNA的smORF是真正翻译的?lncRNA编码多肽的功能是如何激活的?lncRNA编码多肽的翻译机制是什么?等尚不清楚。. 因此,本项目拟通过建立和优化高通量、高灵敏度的lncRNA编码多肽分析技术方法;系统分析和鉴定不同组织和细胞的lncRNA编码多肽,构建可信度高、数量丰富的lncRNA编码多肽数据库;系统分析和鉴定肿瘤相关的lncRNA编码多肽;以期为lncRNA的结构、功能及其调控机制提供新的理论基础,也为从不同于蛋白质编码基因的角度为基因组的结构与功能注释和阐明提供一个新的突破口。
越来越多的研究证据表明,长链非编码RNA(lncRNA)可以通过短的开放阅读框(smORFs)编码具有特定生物学功能的多肽(我们称之为lncRNA编码多肽,SEPs),并广泛参与调节不同的生物学过程,且这种现象被发现广泛存在于酵母、线虫、果蝇、植物、哺乳动物以及人类等不同的物种。尽管如此,关于lncRNA编码多肽的结构与功能的研究还面临诸多的困惑和挑战。诸如究竟有多少lncRNA的smORF是真正翻译的?lncRNA编码多肽的功能是如何激活的?lncRNA编码多肽的翻译机制是什么?等尚不清楚。对于这些问题的解答有赖于可信度高、数量丰富的lncRNA编码多肽数据库的建立和完善。然而,由于lncRNA编码多肽具有分子量小、保守性差和丰度较低的特点,使得在高度复杂、动态范围广的生物体系中规模性地发现和鉴定lncRNA编码多肽具有很大的挑战。.有鉴于此,本项目利用目前国际上最全的lncRNA数据库NONCODE,通过生物信息学分析手段对lncRNA序列中短的开放阅读框(smORF)进行系统的识别和挖掘,并结合多种翻译模式,构建了一个基于预测的广而全的潜在lncRNA编码多肽理论数据库,并优化了基于分子量截留膜过滤与固相萃取联合富集多肽的方法,系统建立了一套高灵敏、高通量的lncRNA编码多肽分析技术平台。利用这一平台,我们对不同细胞系和组织的lncRNA编码多肽进行了系统的分析和鉴定,构建了可信度高、覆盖600多个lncRNA编码多肽的数据库,并系统分析和鉴定了许多肿瘤相关的lncRNA编码多肽,为lncRNA的结构、功能及其调控机制的研究提供了坚实的数据基础,也为从不同于蛋白质编码基因的角度为基因组的结构与功能注释和阐明提供一个新的突破口。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
低轨卫星通信信道分配策略
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
结核性胸膜炎分子及生化免疫学诊断研究进展
高通量组蛋白翻译后修饰分析技术的建立及其在表观遗传学研究中的应用
具有精密微纳结构的高通量编码微球库的建立及其编码性能的构效关系研究
LncRNA-1810058I24Rik及其编码多肽在视网膜发育和维持中的调控作用
快速高通量的遗传性骨病致病基因检测技术系统的建立和临床应用