Protein coding genes are highly conserved, but lncRNA genes are not. Our previous studies reveal that the orthologues of the 13562 GENCODE-annotated human lncRNAs in 16 mammals show distinct clade- and species-specific gains and losses. Since so far the clade- and species-specificity of lncRNAs remain rather elusive and poorly examined, in this study we will identify the orthologues of the 10481 GENCODE-annotated mouse lncRNAs in these 16 mammals, and to use the obtained two lines of orthologous lncRNA genes to investigate and answer the following important questions: (1) what lncRNAs have been gained and lost in different clades and species in mammalian evolution? (2) what mechanisms facilitate different clades and species to obtain specific lncRNAs? (3) whether primate- and rodent-specific lncRNAs show distinct evolutionary features? (4) what are the DNA binding sites and target genes of species-specific lncRNAs? Finally, we will integrate the orthologues of the 10481 mouse lncRNAs in the 16 mammals into the database of the human lncRNA orthologues, providing abundant and unique data for experimental and computational lncRNA and epigenomics studies.
蛋白质编码基因是高度保守的,但lncRNA基因却呈高度的种系特异性。我们的前期工作揭示GENCODE项目报道的13562个人类lncRNA在16个哺乳动物有显著的种系特异性获得与丢失。鉴于对lncRNA种系特异性迄今少有分析与报道,本项目将进一步搜索GENCODE项目报道的10481个小鼠lncRNA在这16个哺乳动物的同源基因,利用这两批lncRNA在多个clade与species的同源基因分析与揭示:①不同clade/species在进化中获得和丢失了哪些lncRNA?②什么因素使不同物种获得不同的特异性lncRNA?③灵长类/啮齿类特异的lncRNA是否有不同的进化特征?④种系特异性lncRNA调控多少及哪些种系特异性靶基因?并最后将小鼠lncRNA同源基因集成进已构建的人类lncRNA同源基因数据库,为lncRNA与基因组修饰的实验与计算研究提供海量、重要且独特的数据。
完成以下5项与课题主题密切的工作:①开发了一个跨物种全基因组lncRNA分析流程,实现高效跨物种全基因组lncRNA分析,②分析了结肠癌中lncRNA介导的异常表观遗传调控,③识别了人类特异性lncRNA并对它们进行了种群差异分析、进化分析、功能分析,④识别了小鼠特异性lncRNA,分析了转座子对人类特异性和小鼠特异性lncRNA产生和功能的决定性影响,⑤利用人类与小鼠13种肿瘤的转录组数据进行了跨物种泛癌分析,着重分析了lncRNA介导的表观遗传调控在人类/小鼠肿瘤中的差异。完成以下2项与课题主题相对不密切的工作:⑥将因果分析用于单细胞分析,揭示基因表达调控的因果关系,⑦将深度学习与统计方法结合,识别人类基因组中的正选择信号,分析适应性进化与疾病易感性的关系。上述工作覆盖两个维度:同源lncRNA->种系特异性lncRNA->种系特异性lncRNA的决定因素(转座子)->肿瘤中的lncRNA->人类/小鼠泛癌分析,以及方法->软件->数据库->网站。这些工作得到以下结论:①人类与小鼠特异性lncRNA有非常不同的靶基因,②人类与小鼠特异性lncRNA尽管数量不多,但非常高程度地重塑人类与小鼠的表观遗传调控,③灵长类和啮齿类转座子深度且特异性地决定人类与小鼠特异性lncRNA的产生和功能,④在许多人类肿瘤中具有重要表观遗传调控作用的lncRNA是灵长类或类人猿特异的,提示种系特异性lncRNA及其介导的表观遗传调控对人类疾病具有重要作用,也提示用小鼠模型研究人类疾病需要非常小心,⑤因果分析可有效揭示单细胞转录组和蛋白质组数据中蕴含的基因表达调控信息。已发表4篇论文(3篇为通讯作者),5篇论文正在或即将投稿。成果已转化为生物信息学资源与设施,包括开发了1个跨物种全基因组lncRNA分析流程,增强了1个前期开发的lncRNA数据库,开发了1个多种群基因组有利突变数据库,开发了1个单细胞因果分析流程和网站。根据研究结果建立了多项合作研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
哺乳动物中病毒特异性siRNA的功能机制
卵巢特异性lncRNA OSTR对卵巢生殖干细胞的功能影响与相关应用研究
奇蹄类起源与中国早始新世哺乳动物地理研究
胶质细胞相对特异性新基因LRRC4功能的进一步研究