The circular RNA is a type of endogenous non-coding RNA which is covalently closed continuous loop generated by the back-spliced event. It plays important roles in many biological processes. Previous studies indicated that multiple circular RNA transcripts can be produced within the same back-spliced locus by alternative splicing, and expressed specifically in diversified species or tissues. However, the problem of circular RNA full length assembly and quantification is still not well solved. Our preliminary data showed that network flow model can be used in circular RNA transcripts internal structure. Therefore we intend to investigate the full length circular RNA transcripts assembly and quantification algorithm using multi-network flow model. In this project, we will firstly employ RPAD protocol to enrich the circular RNA in the HeLa cell samples, make sequencing data of its transcriptomics, and identify the back-spliced sites. We will investigate multiple network flow model for the circular RNA transcripts internal structure, develop the software pipeline to reconstruct circular RNA full length transcripts, which will validated by PCR and Sanger sequencing. In the end, we will study the statistical methods for abundance estimation of circular RNA transcripts, which will be validated by RT-qPCR. The results gained from the proposed studies will help us to understand molecular mechanism of circular RNA alternative splicing events, and provide the tool for circular RNA functional study.
环形RNA是通过反向剪接事件而形成封闭环状结构的一类内源性非编码RNA分子,具有重要生物学功能。已有研究表明环形RNA在同一反向剪接位点内部通过可变剪接事件形成多个环形RNA转录本,并具有物种和组织表达特异性。但是,环形RNA全长转录本组装与定量问题仍未获得较好的解决。项目前期通过研究发现网络流模型可以用来刻画环形RNA转录本特有结构。因此本项目拟采用网络流模型对环形RNA全长转录本组装与定量展开研究。首先采用RPAD方法富集和纯化环形RNA,获得环形RNA转录本测序数据,并识别反向剪接位点;接着基于环形RNA内部结构特点构建多网络流模型,研究环形RNA全长转录本组装方法,并实验验证;最后采用概率统计模型对环形RNA转录本丰度进行定量研究并实验验证。研究成果将有助于深入理解环形RNA内部的可变剪接事件及其转录本的形成机制,为深入研究环形RNA的生物学功能提供有价值的方法学工具。
环形RNA(circRNAs)是一类经由反向剪接事件产生、以共价键连接形成封闭环状结构的特殊内源性非编码RNA。已有的研究证实环形RNA具有重要的生物学功能,并与包括癌症在内的多种重大疾病密切相关。获取环形RNA转录本的全长序列并对可变剪接产物进行定量是环形RNA功能研究中的首要关键环节。由于现行实验中用RNase R来富集环形RNA的方法并不能完全去除线性RNA,而全转录组数据可以在研究环形RNA的同时很好的保留线性及其他非编码RNA信息,对环形RNA的功能研究更有帮助,故针对全转录组测序数据开发一套能够同时组装和定量线性、环形RNA的可靠工具,对更好地了解线性、环形RNA在体内的表达特征,筛选研究特定功能的线性、环形RNA分子具有十分重要的意义。然而全转录组数据中环形RNA的丰度较低,且环形RNA与其同源线性RNA之间存在大量的重叠区域,这对线性、环形RNA转录本的组装和定量来说是一个挑战。我们基于多网络流模型和期望最大化(EM)算法开发了用于组装并定量线性和环形转录本的算法CircAST2,并利用模拟和真实转录组数据验证了算法的准确性和有效性。结果表明,CircAST2能有效去除组装结果中的假阳性转录本,有着较高的准确度和灵敏度,也能实现线性、环形RNA在转录本水平的精确定量,为研究者们更加精准全面地解析线性和环形转录本、筛选具有潜在生物功能的RNA可变剪接异构体提供了有效的工具,为深入研究转录本的生物学功能提供重要帮助。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
环形RNA全长转录本的重建和定量方法
人类心脏全长转录本注释构建及其在心肌病研究中的应用
基于RNA-seq策略研究天然反义转录本的调控机制
基于网络动态配流的应急疏散交通组织优化模型与方法