果蝇非编码基因组(ncRNA)研究

基本信息
批准号:31100601
项目类别:青年科学基金项目
资助金额:23.00
负责人:鲁志
学科分类:
依托单位:清华大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:刘亚蒂,韦利,张晓磊,李婷,王肖朦,邸超
关键词:
生物信息RNA二级结构预测新一代测序非编码基因高通量数据
结项摘要

现阶段编码蛋白的基因已经在各个基因组中有了深入的研究和较好的注释,但是非编码基因的全面注释还是一个空白。很多实验证据表明非编码基因具有重大的生物功能。 基于我在模式生物和人类基因组方面的经验, 我们将利用最新一代的大规模测序数据和RNA结构预测算法,开发专门应用于果蝇基因组的非编码基因预测算法。这一算法是一种机基于果蝇全基因组规模上的机器学习模型,用于预测和发现全基因组水平上的非编码RNA,ncRNA。通过在果蝇基因组里优化该数学模型,我们期望准确的将已知的非编码基因和已知的蛋白质编码基因区别开来。并进一步在基因间的未知区域预测大量新基因。根据在人类和线冲基因组中的结果,这一方法的准确度将高于90%。我们将进一步的利用TF和POLII的节后位点,在不同组织中的差异表达群,对这些新基因进行分类。最终,我们将对预测出的基因做生化上的实验验证,为进一步的生物功能验证提供好的靶点。

项目摘要

现阶段编码蛋白的基因已经在各个基因组中有了深入的研究和较好的注释,但是非编码基因的全面注释以及相关的生物信息学鉴定方法还亟待完善。使用高通量转录组数据可以拼接出很多新的非编码RNA转录本,其中长度大于200nt的长链非编码RNA由于其新颖性以及多种多样的重要生物学功能而备受瞩目。然而,在数以万计的长链非编码RNA中,只有很少数(100-200)得到了确切的实验验证和功能解释。为了能够更全面准确地发现鉴定新型非编码RNA,并对其进行具体的加工和功能特性预测,我们收集、测序和分析了大量的高通量数据,发展了一系列基于机器学习和结构预测的生物信息学方法,系统而有效地在人类、小鼠、果蝇、线虫和拟南芥等多物种上对新型非编码RNA进行了鉴别、注释和功能探究。具体进展如下: 首先我们发展了一种跨物种特征选择的方法,发现了不同种类非编码RNA共有的典型特征(NAR, 2014)。我们在多个物种中整合了超过600套的高通量数据以及多种进化和生物物理的相关特征值。最终我们筛选出10个序列、结构、表达和表观修饰的特征。我们使用这10个特征可以高度准确的在四个物种内(准确度 0.92~0.96)、四个物种间(准确度 0.71~0.89)预测非编码RNA,不仅可以灵敏地找到新型的非编码RNA(平均跨种类预测灵敏度0.89)。同时还可以找到在长非编码RNA中可能的功能结构域,从而可以为后续的实验验证提供更多的依据。其次,我们针对植物发展了一套鉴定长链非编码RNA的生物信息学方法,找出了植物逆境生长相关的非编码RNA,并对这些非编码RNA进行了功能验证和特性分析(The Plant Journal, 2014)。我们发现,没有polyA尾巴的非编码RNA有更短的长度和更低的表达量,而且在干旱条件下显著富集,在高温条件下显著缺失。此外,在不同逆境条件下的非编码RNA有着不同的序列和结构。最后,我们参与国际ENCODE项目,完善了我们之前开发的非编码RNA的生物信息学鉴定方法,并成功应用到了人类、线虫和果蝇三个基因组上(Nature, 2014)。该方法整合了GC含量、DNA保守性、RNA结构稳定性和保守性、表达值、表观遗传学修饰信号值等特征,对全基因组每50nt都进行了非编码可能性的预测。RT-PCR的验证也表明预测结果的可信性, 即12个非编码RNA中的10个能够检测到清晰的目的片段。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
4

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

鲁志的其他基金

批准号:31771461
批准年份:2017
资助金额:57.00
项目类别:面上项目
批准号:31271402
批准年份:2012
资助金额:95.00
项目类别:面上项目

相似国自然基金

1

线粒体非编码RNA(ncRNA)生物学功能的研究

批准号:31200976
批准年份:2012
负责人:李桂玲
学科分类:C0602
资助金额:20.00
项目类别:青年科学基金项目
2

建立果蝇与线虫ncRNA基因功能鉴定技术平台

批准号:30750001
批准年份:2007
负责人:樊启昶
学科分类:C0704
资助金额:20.00
项目类别:专项基金项目
3

乳酸乳球菌耐酸长链非编码ncRNA263的调控机制研究

批准号:31770076
批准年份:2017
负责人:乔建军
学科分类:C0102
资助金额:60.00
项目类别:面上项目
4

调控家蚕发育非编码RNA(non-coding RNA, ncRNA)的功能解析

批准号:31172158
批准年份:2011
负责人:阚云超
学科分类:C0405
资助金额:60.00
项目类别:面上项目