Long noncoding RNA (lncRNA) is an important kinds of non-coding RNAs. They have been found to take a large amount in transcriptome and play important roles in biological regulatory process in recent years. However, limited lncRNAs were well studied about their functions, most of them were functionally and originally unknown. Fortunately, the rapidly developed sequencing technology and bioinformatic algorithm can help us identity lncRNAs extensively and study the evolution and functions of lncRNAs systematically from big data perspective. In this project, we select representative plant species in evolution, as well as genome information well studied as study object. Based on the strand-specific RNA-seq data from Illumina sequencing platform, we analyze the distribution patterns and sequence features of lncRNAs systematically by combining bioinformatic analysis and multiple experiment verification, and analyze the evolutionary laws by finding conserved and specific lncRNAs in different evolutionary groups. Then, we predict the functions of lncRNAs by constructing a co-expression network of lncRNA and coding genes, and verify these functions in Arabidopsis by constructing over-expression and CRISPR system. We aim to elaborate the keys and functions of lncRNAs in plant evolution process from aquatic to terricolous, vascular tissue formation and organ differentiation by combing the study of co-expression network, conserved and specific lncRNAs and experiment verification.
Long non-coding RNA(lncRNA)是非编码RNA的重要成员,由于在生物体内数量庞大且发挥重要调控功能,近几年被广泛关注,但功能已知的lncRNA仅是极少部分,大部分lncRNA的功能和来源未知。快速发展的高通量测序技术和生物信息学算法能够帮助我们从大数据角度系统研究lncRNA的进化和功能。本课题以基因组信息完善且在进化上具有代表性的植物为研究对象,以高通量测序数据为基础,结合生物信息学算法分析和多重实验验证,对lncRNA在植物中的分布模式和序列特征进行分析,找出在不同进化类群中保守的和特异的lncRNA,研究lncRNA在植物中的进化规律。另外,通过构建lncRNA和编码基因的共表达调控网络对lncRNA的功能进行预测,并在拟南芥中构建过表达和CRISPR敲除系统对预测的功能进行验证,最后综合以上分析揭示lncRNA在植物由水生向陆生演化过程中可能发挥的作用。
近些年,随着对Long non-coding RNAs (lncRNAs)研究的不断深入,lncRNA在植物中被广泛鉴定。虽然lncRNA数量不断增长,但是关于其在植物中的分子特征、表达模式以及进化过程却没有被深入研究。植物从水生向陆生生活的转变是植物进化过程中的重要转折,随着lncRNA在植物中大量发现,是否lncRNA也参与这一重要进程仍未可知。.围绕以上两个科学问题,本课题通过收集在植物系统发育节点位置上的代表性植物,运用全转录组链特异测序手段对基因组上的lncRNA进行全面分析,揭示了lncRNA在植物基因组中的表达分布、起源进化,以及在植物从水生向陆生适应性进化过程中发挥的重要作用。具体内容包括1)我们利用公共数据库和自己测序的数据,成功构建了鉴定lncRNA的生物信息学流程。我们鉴定到所选物种最全面的lncRNA集合。发现lncRNA在植物基因组上广泛分布于基因间区和编码基因的反义链,使得我们对植物中lncRNA的存在形式有了新的认识。2)我们将lncRNA与编码基因进行比较,发现lncRNA结构更加简单,且序列组成与编码基因存在差异,但在各个植物类群中的特征趋于保守,说明lncRNA在植物中有着相同的来源。进一步的分析发现,转座子在植物lncRNA的起源和转录调控中都发挥重要作用。超过30%的lncRNA启动子序列来源于TE的插入,并且exon中保留了更多的TE序列。更重要的是,我们发现了一种新的lncRNA起源方式,即通过在exon上游插入promoter使得lncRNA的转录得以发生,从而在基因组间区位置上产生新的lncRNA。3)通过研究lncRNA在各植物类群中的保守性,我们发现lncRNA序列差异极大,仅观察到在属内保守的lncRNA,说明lncRNA在属分化以后产生,部分lncRNA甚至是在种形成以后才出现。同时,我们还发现一个lncRNA(IPS)在植物从水生到陆生的适应性进化中发挥重要作用。4)通过构建WGCNA共表达调控网络,我们发现大部分特异性高表达的lncRNA能够和编码基因形成共表达网络,且功能发挥与他们的表达位置密切相关。5)我们在拟南芥中成功构建了CRISPR-Cas9系统,该系统能够对目标lncRNA进行整片段敲除,为后续表型筛选和功能鉴定奠定重要技术基础。.本课题发表SCI研究论文2篇,申请专利1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
组学大数据解析植物演化过程中代谢组进化规律和种群特异代谢调控
整合多维组学数据识别多种癌症的驱动长非编码RNA
玉米籽粒长非编码RNA的调控网络解析
长链非编码RNA在HBV相关肝癌发生过程中调控功能研究