Long non-coding RNA (lncRNA) can regulate gene expression in a variety of levels. Exploring the functions of lncRNAs has a great biological significance in understanding complex regulatory systems for human life, improving the ability to prevent and treat human diseases as well as to explore the laws of biological evolution. As more and more lncRNAs are found, traditional experimental methods can't meet the current needs of function annotation for lncRNAs. This research will use the methods and techniques in the field of Biology, Mathematics, Physics and Computer Science, to explore new algorithms for large-scale prediction of lncRNA functions. The study includes: 1) Study high-performance protein structure alignment methods and multi-information fusion based lncRNA homology detection technologies, design non-linear models to evaluate the large number of potential lncRNA-protein interaction pairs; 2) Study cross-species co-expression data fusion algorithms, build lncRNA function prediction models with network topology parameters and community mining in bipartite networks; 3) Use the weighted method to integrate multiple function associated networks, propose new function prediction methods with graph theory and complex networks; 4) Propose integrated large scale lncRNA function prediction methods, develop integrated prediction platforms and databases.
长非编码RNA(lncRNA)能在多种层面上调控基因表达,揭示lncRNA的功能对于认识生命体复杂的调控体系、提高人类预防和治疗疾病的能力以及探索生物进化规律等都具有巨大的生物学意义。随着越来越多的lncRNA被发现,使用传统实验方法来识别lncRNA的功能已远远不能满足当前的需要。本课题将结合生物学、数学、物理学和计算机等领域的方法和技术,探索大规模lncRNA功能预测的新技术和新算法。研究内容包括:1)研究高性能结构比对算法和多信息融合的lncRNA同源识别技术,设计非线性评估模型对大量潜在lncRNA-蛋白质相互作用对进行有效评估;2)研究跨物种共表达数据融合算法,构建基于网络拓扑参数和二分网络社区挖掘的lncRNA功能预测模型;3)运用加权方法对多重功能关联网络进行融合,提出基于图论和复杂网络的新的功能预测方法;4)研究大规模lncRNA功能集成预测方法,开发综合预测平台和数据库。
确定lncRNA的功能对于揭示其在生理及病理过程中的作用机制、疾病诊断和防治都有重要的意义。本课题针对lncRNA功能预测领域的新挑战,通过深入研究lncRNA功能关系, 提出基于结构比对、跨物种共表达网络、多重功能关联网络和集成学习等的lncRNA功能预测新方法与新技术,开发lncRNA功能综合预测软件平台和集成的lncRNA功能标注数据库。本项目的主要工作与成果包括:. 1)通过广泛收集整理lncRNA功能标注数据,建立了第一个lncRNA功能标注基准测试数据集(lncRNA2GO-55),为lncRNA功能计算预测方法的性能评估奠定了基础,得到了大量应用。开发了蛋白质结构域功能标注数据库,有助于分析和理解蛋白质的功能。. 2)根据lncRNA-蛋白质的共表达数据及相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据,构建全局的异构网络,提出了一种大规模预测lncRNA功能的方法(KATZLGO)。通过Katz度量计算lncRNA顶点和蛋白质顶点的相似性,从而依据相似蛋白质的功能标注信息对未知的lncRNA进行功能标注。由于该方法是一种基于图的全局计算方法,所以可以一次标注出大量的lncRNA,能有效地克服以前局部方法一次只能标注少量lncRNA功能的问题。. 3)提出了一种基于多神经网络的层次多标签分类新方法(NeuraNetL2GO)来预测lncRNA的本体功能。多个神经网络逐级递增进行训练,每个神经网络都对属于给定层次的基因本体(Gene Ontology, GO)进行预测。在该方法中,利用lncRNA相似网络的拓扑特征作为神经网络的输入,并根据输出结果对lncRNA进行功能标注,在lncRNA2GO-55数据集上取得了最好的效果。而且,该方法还能避免其它方法中预测不一致的问题。. 4)根据已知的lncRNA与疾病之间的关联,研究了一种推断lncRNA和疾病关联的方法(LncRDNetFlow)。该方法根据多种异构数据(lncRNA-疾病关系数据,蛋白质相互作用数据、lncRNA-蛋白质相互作用数据等)构建一个全局异构网络,然后通过网络传播算法来识别可能的lncRNA 和疾病的关联。在此方法中,通过融合更多的生物数据可比以前的技术更能准确地预测出lncRNA和疾病的关联关系。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
跨社交网络用户对齐技术综述
低轨卫星通信信道分配策略
基于多模态信息特征融合的犯罪预测算法研究
面向云工作流安全的任务调度方法
基于多源生物数据的长非编码RNA预测方法研究
基于多网络融合的长链非编码RNA与疾病关系预测研究
长非编码RNA序列结构特征信息挖掘及其预测方法研究
多视角识别长非编码RNA和人类复杂疾病关联预测研究