基于结构和多源异构信息融合的大规模长非编码RNA功能预测

基本信息
批准号:61672541
项目类别:面上项目
资助金额:62.00
负责人:邓磊
学科分类:
依托单位:中南大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:邝砾,张少军,詹卫华,张敬普,黄瑞,刘帝伟,范超,曾丞
关键词:
长非编码RNA结构多源异构信息功能复杂网络
结项摘要

Long non-coding RNA (lncRNA) can regulate gene expression in a variety of levels. Exploring the functions of lncRNAs has a great biological significance in understanding complex regulatory systems for human life, improving the ability to prevent and treat human diseases as well as to explore the laws of biological evolution. As more and more lncRNAs are found, traditional experimental methods can't meet the current needs of function annotation for lncRNAs. This research will use the methods and techniques in the field of Biology, Mathematics, Physics and Computer Science, to explore new algorithms for large-scale prediction of lncRNA functions. The study includes: 1) Study high-performance protein structure alignment methods and multi-information fusion based lncRNA homology detection technologies, design non-linear models to evaluate the large number of potential lncRNA-protein interaction pairs; 2) Study cross-species co-expression data fusion algorithms, build lncRNA function prediction models with network topology parameters and community mining in bipartite networks; 3) Use the weighted method to integrate multiple function associated networks, propose new function prediction methods with graph theory and complex networks; 4) Propose integrated large scale lncRNA function prediction methods, develop integrated prediction platforms and databases.

长非编码RNA(lncRNA)能在多种层面上调控基因表达,揭示lncRNA的功能对于认识生命体复杂的调控体系、提高人类预防和治疗疾病的能力以及探索生物进化规律等都具有巨大的生物学意义。随着越来越多的lncRNA被发现,使用传统实验方法来识别lncRNA的功能已远远不能满足当前的需要。本课题将结合生物学、数学、物理学和计算机等领域的方法和技术,探索大规模lncRNA功能预测的新技术和新算法。研究内容包括:1)研究高性能结构比对算法和多信息融合的lncRNA同源识别技术,设计非线性评估模型对大量潜在lncRNA-蛋白质相互作用对进行有效评估;2)研究跨物种共表达数据融合算法,构建基于网络拓扑参数和二分网络社区挖掘的lncRNA功能预测模型;3)运用加权方法对多重功能关联网络进行融合,提出基于图论和复杂网络的新的功能预测方法;4)研究大规模lncRNA功能集成预测方法,开发综合预测平台和数据库。

项目摘要

确定lncRNA的功能对于揭示其在生理及病理过程中的作用机制、疾病诊断和防治都有重要的意义。本课题针对lncRNA功能预测领域的新挑战,通过深入研究lncRNA功能关系, 提出基于结构比对、跨物种共表达网络、多重功能关联网络和集成学习等的lncRNA功能预测新方法与新技术,开发lncRNA功能综合预测软件平台和集成的lncRNA功能标注数据库。本项目的主要工作与成果包括:. 1)通过广泛收集整理lncRNA功能标注数据,建立了第一个lncRNA功能标注基准测试数据集(lncRNA2GO-55),为lncRNA功能计算预测方法的性能评估奠定了基础,得到了大量应用。开发了蛋白质结构域功能标注数据库,有助于分析和理解蛋白质的功能。. 2)根据lncRNA-蛋白质的共表达数据及相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据,构建全局的异构网络,提出了一种大规模预测lncRNA功能的方法(KATZLGO)。通过Katz度量计算lncRNA顶点和蛋白质顶点的相似性,从而依据相似蛋白质的功能标注信息对未知的lncRNA进行功能标注。由于该方法是一种基于图的全局计算方法,所以可以一次标注出大量的lncRNA,能有效地克服以前局部方法一次只能标注少量lncRNA功能的问题。. 3)提出了一种基于多神经网络的层次多标签分类新方法(NeuraNetL2GO)来预测lncRNA的本体功能。多个神经网络逐级递增进行训练,每个神经网络都对属于给定层次的基因本体(Gene Ontology, GO)进行预测。在该方法中,利用lncRNA相似网络的拓扑特征作为神经网络的输入,并根据输出结果对lncRNA进行功能标注,在lncRNA2GO-55数据集上取得了最好的效果。而且,该方法还能避免其它方法中预测不一致的问题。. 4)根据已知的lncRNA与疾病之间的关联,研究了一种推断lncRNA和疾病关联的方法(LncRDNetFlow)。该方法根据多种异构数据(lncRNA-疾病关系数据,蛋白质相互作用数据、lncRNA-蛋白质相互作用数据等)构建一个全局异构网络,然后通过网络传播算法来识别可能的lncRNA 和疾病的关联。在此方法中,通过融合更多的生物数据可比以前的技术更能准确地预测出lncRNA和疾病的关联关系。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

邓磊的其他基金

批准号:61675083
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:31900670
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目
批准号:81602670
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:61309010
批准年份:2013
资助金额:27.00
项目类别:青年科学基金项目
批准号:11502212
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:51205143
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:60803013
批准年份:2008
资助金额:18.00
项目类别:青年科学基金项目
批准号:51675200
批准年份:2016
资助金额:57.00
项目类别:面上项目
批准号:51301066
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:61902256
批准年份:2019
资助金额:28.00
项目类别:青年科学基金项目
批准号:61307091
批准年份:2013
资助金额:26.00
项目类别:青年科学基金项目
批准号:40801172
批准年份:2008
资助金额:19.00
项目类别:青年科学基金项目
批准号:31601759
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于多源生物数据的长非编码RNA预测方法研究

批准号:61301220
批准年份:2013
负责人:孙磊
学科分类:F0124
资助金额:23.00
项目类别:青年科学基金项目
2

基于多网络融合的长链非编码RNA与疾病关系预测研究

批准号:61702122
批准年份:2017
负责人:兰伟
学科分类:F0213
资助金额:25.00
项目类别:青年科学基金项目
3

长非编码RNA序列结构特征信息挖掘及其预测方法研究

批准号:61671107
批准年份:2016
负责人:王吉华
学科分类:F0124
资助金额:65.00
项目类别:面上项目
4

多视角识别长非编码RNA和人类复杂疾病关联预测研究

批准号:61772531
批准年份:2017
负责人:陈兴
学科分类:F0213
资助金额:16.00
项目类别:面上项目