基于多源生物数据的长非编码RNA预测方法研究

基本信息

批准号：61301220

项目类别：青年科学基金项目

资助金额：23.00

负责人：孙磊

学科分类：

依托单位：扬州大学

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：胡学龙,刘维,王刚,范谦

关键词：

基因预测基因定位核酸序列预测

结项摘要

Long non-coding RNAs (lncRNAs) play an important role in the formation of relevant diseases and biological activities via various mechanisms, e.g. regulating DNA methylation, histone modification, chromatin modification and being precursor of small RNAs. Prediction of lncRNA gene structures and locations is a key problem for studying lncRNAs, especially for lncRNA function analysis. According to low accuracy of lncRNA prediction based on RNA-Seq data, this project proposes a high-reliable approach for lncRNA prediction based on multi-source biological data including the second generation sequencing reads, genome sequences, gene annotations, protein databases and mass spectrometry data. The project will extract biological information including nucleic acid sequences, transcription factor binding sites (TFBSs), 3' polyadenylation signals and so on from the multi-source biological data using bioinformatics methods such as statistical analysis, mathematical modeling and machine learning. Significantly, the project will present several algorithms for transcriptome reconstruction of overlap genes, filtering low quality transcripts and ncRNA recognition respectively, which can jointly improve the accuracy of lncRNA prediction. As a result, the project will realise an efficient method for lncRNA prediction, which can provide reliable information of gene structures and locations for further function analysis of the lncRNAs.

长非编码RNA（lncRNA）参与调节DNA甲基化、组蛋白修饰、染色质重构及作为小RNA前体，在相关疾病形成和生命活动中发挥着重要作用。lncRNA的基因结构和位置预测是lncRNA研究的关键性问题，是lncRNA功能分析的基础。针对当前基于RNA-Seq数据的lncRNA预测准确度不高的现状，本项目拟以二代测序读段、基因组序列、基因注释、蛋白质库、质谱数据等多源生物数据为基础，建立高可靠性的lncRNA预测方法。本项目将运用统计分析、数学建模、机器学习等生物信息学方法，从多源生物数据中提取核酸序列、转录因子绑定位点（TFBSs）、3'加尾信号等生物信息，建立重叠基因的转录本重建算法、低质量转录本过滤算法及ncRNA识别算法，以提高lncRNA预测的准确度。本项目将实现高效的lncRNA预测方法，该方法能够为lncRNA功能分析提供可靠的基因结构和位置信息。

项目摘要

长非编码RNA(long noncoding RNA, lncRNA)是一类具有重要生物学功能的非编码RNA，在红细胞生成、胚胎干细胞全能性、癌症、胚胎发育、神经发生和神经精神障碍等生物过程或疾病中发挥作用。对lncRNA的准确预测是lncRNA特征分析、转录调控研究、功能和机制研究等后续研究的基础，现已成为生物信息学研究的热点。随着高通量测序技术的发展和应用，产生了大量可用于lncRNA预测的生物数据。这些数据来源广泛，主要包括基因注释、基因组序列、表观遗传、转录因子绑定位点、物种间序列比对、保守性分值等。本项目有效利用以上多源生物数据，重点针对lncRNA预测相关的生物信息学方法展开研究，主要涉及lncRNA预测算法的研究和设计、lncRNA特征分析、lncRNA特异性的转录因子绑定位点分析、lncRNA数据采集和计算平台的构建等。. 项目执行期间，成功设计并实现了基于支持向量机(support vector machine, SVM)的lncRNA预测方法、基于随机森林(random forest, RF)的lncRNA预测方法，完成对lncRNA基因的特征分析、lncRNA特异性的转录因子绑定位点分析，构建了基于高性能计算和云计算的lncRNA数据采集和计算平台。本项目共资助发表正式刊物论文11篇，其中已发表SCI/EI检索论文5篇，中文核心期刊论文2篇，另有3篇论文被录用/在印（1篇EI检索）。此外，在重要会议发表论文/摘要3篇。申请计算机软件著作权1项。. 本项目的研究工作为lncRNA预测研究提供了良好的生物信息学方法和平台，加深了学界对lncRNA的认识。未来课题组将立足于该项目的研究工作，逐步扩充和丰富lncRNA信息平台的内容（包括算法工具和数据库），不断提出富有意义和创新性的生物信息学方法，为更加全面深入地研究和解析lncRNA提供支持。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3969/j.issn.1673-1689.2021.10.004

发表时间：2021

DOI：10.19679/j.cnki.cjjsjj.2019.0538

发表时间：2019

DOI：

发表时间：2018

DOI：10.11999/JEIT210095

发表时间：2021

DOI：10.19818/j.cnki.1671-1637.2021.05.022

发表时间：2021

孙磊的其他基金

批准号：61673059

批准年份：2016

资助金额：16.00

项目类别：面上项目

批准号：31100002

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：31900527

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：61902107

批准年份：2019

资助金额：18.00

项目类别：青年科学基金项目

批准号：31800667

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：21403211

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：51904338

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：81202316

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：81000326

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：81602890

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：51907043

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：81303214

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：81300511

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：61904031

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：50701016

批准年份：2007

资助金额：22.00

项目类别：青年科学基金项目

相似国自然基金

基于结构和多源异构信息融合的大规模长非编码RNA功能预测

批准号：61672541

批准年份：2016

负责人：邓磊

学科分类：F0213

资助金额：62.00

项目类别：面上项目

基于多网络融合的长链非编码RNA与疾病关系预测研究

批准号：61702122

批准年份：2017

负责人：兰伟

学科分类：F0213

资助金额：25.00

项目类别：青年科学基金项目

长非编码RNA序列结构特征信息挖掘及其预测方法研究

批准号：61671107

批准年份：2016

负责人：王吉华

学科分类：F0124

资助金额：65.00

项目类别：面上项目

多视角识别长非编码RNA和人类复杂疾病关联预测研究

批准号：61772531

批准年份：2017

负责人：陈兴

学科分类：F0213

资助金额：16.00

项目类别：面上项目

基于多源生物数据的长非编码RNA预测方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

基于LASSO-SVMR模型城市生活需水量的预测

基于多模态信息特征融合的犯罪预测算法研究

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

多源数据驱动CNN-GRU模型的公交客流量分类预测

孙磊的其他基金

基于累积残余信息的高维高冗余信号特征选择与提取方法研究

中国兰属植物内生细菌群落多样性研究

TM9SF4调控非小细胞肺癌细胞凋亡机制研究

具有多种良好密码学性质的旋转对称布尔函数的研究

通过定向进化和半理性设计扩展酰基转移酶DutH底物谱并探索其机理

计算筛选应用于固态敏化太阳能电池中的钙钛矿材料

含锡有色金属炼渣中锡的选冶联合高效回收基础和应用研究

2型甲酰肽受体调控M2型巨噬细胞极化的分子机制及其在炎症反应中的作用

人调节性T细胞在人源化糖尿病鼠中的免疫调节及抗糖尿病作用

miRNA-204在慢性应激诱导的早期生精细胞凋亡中的作用及机制研究

含风储联合系统的输电系统恢复协同优化决策理论与方法

中药整体质量评价中一种新的替代对照品技术“双标多测法”的建立研究

中国人群SHBG基因及其多态性在妊娠期糖尿病发生发展中的分子机制研究

图形化场致发射电子源的全溶液法制备及电子发射调控研究

液氨介质中复合金属纳米微粒的制备及性能研究

相似国自然基金