面向蛋白质分子位点标记的多源特征提取和深度序列学习方法研究

基本信息

批准号：61462018

项目类别：地区科学基金项目

资助金额：47.00

负责人：樊永显

学科分类：

依托单位：桂林电子科技大学

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：潘小勇,陈光喜,张向文,李灵巧,郑卓远,潘细朋,张晓凤,谢谱模,金义冬

关键词：

蛋白质分子特征提取条件随机场深度学习位点标记

结项摘要

During the post-genomic era, a growing number of protein sequences are determined, how to identify their functional sites is one of the most important issues. The traditional biological experimental determination and validation on functional sites are usually laborious and time-consuming. To timely and effectively discover protein functional sites when facing with the avalanche of new protein sequences, computational methods are emerging. In this project, as protein molecules are multi-source, heterogeneous and complex, we will study from the following several aspects: firstly, different similarity measures for each features of protein molecules are presented. Secondly, to find different motifs of protein functional sites that provide an interpretable theoretical basis for protein functional sites labeling, sequence features, structure features, network features, co-evolution features, evolutionary trace features, physical/biological chemical property features are computed and analyzed. Furthermore, a novel method, deep sequential learning machine, is proposed for labeling protein molecule functional sites based on Deep Learning and Conditional Random Fields. Finally, an effective method for labeling sites of protein molecules is presented, and case studies and genome-wide analysis are carried out using the built prediction models to provide new insights into computation and biology.

在后基因组时代，越来越多的蛋白质分子序列被测定出来，如何确定蛋白质分子的功能位点是最重要的问题之一。传统生物实验的方法费时费力，在这种情况下，计算方法应运而生。本研究拟从蛋白质分子多源、异构、复杂的特征入手，首先研究这些特征的相似性度量问题；其次研究序列特征、结构特征、网络特征、共进化特征、进化踪迹特征、物理/生物化学属性特征等的提取计算分析方法，以寻找确定蛋白质分子位点在各种特征下的相似性模体，为蛋白质分子位点标记提供可解释的理论依据；再结合深度学习和条件随机场理论研究蛋白质分子的功能位点标记问题。最后整体形成有效的蛋白质分子位点标记的计算方法，并基于构建的模型进行个案研究和全基因组分析，为计算和生物学研究提供新的认知。

项目摘要

在后基因组时代，越来越多的生物分子序列被测定出来，如何确定生物分子的相互作用和功能位点是最重要的问题之一。采用传统生物实验的方法费时费力，在这种情况下，计算方法应运而生。本研究从生物分子多源、异构、复杂的特征入手，首先研究这些特征间的相似性度量问题；其次研究序列特征、结构特征、网络特征、共进化特征、进化踪迹特征、物理/生物化学属性特征等的提取计算分析方法，以寻找确定生物分子在各种特征下的相似性模体，为生物分子的相互作用及其位点标记提供可解释的理论依据；再结合深度学习和条件随机场理论研究生物分子的相互作用识别及其功能位点标记问题。在本项目中，我们提出一种称为IPMiner（Interaction Pattern Miner）的计算方法基于分子序列来预测ncRNA和蛋白质的相互作用，该方法利用了深度学习技术，并采用堆叠集成方法进一步提高预测性能。提出了基于条件随机场的LabCaS预测器，LabCaS预测器从整个序列出发来标记钙激活蛋白酶的潜在的剪切位点。我们首次把RNA绑定蛋白的预测当作多标记问题，提出一个称为iDeepM的新的深度学习方法。提出了一种称为iDeepE的计算方法从RNA序列出发来预测RNA与蛋白质的绑定位点，该方法合并了局部和全局的卷积神经网络。提出了一种称为iDeepV的方法来预测RNA与蛋白质的绑定位点。提出了一种基于深度学习的方法iDeepS，使用卷积神经网络（CNNs）和双向长短时记忆网络（BLSTM）自动地从RNA序列出发识别绑定的序列模体和结构模体。基于构建的模型进行个案研究和全基因组分析，为计算和生物学研究提供新的认知。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.7538/hhx.2022.yx.2021092

发表时间：2022

DOI：

发表时间：2021

DOI：10.7498/aps.70.20202116

发表时间：2021

DOI：10.18307/2018.0503

发表时间：2018

DOI：10.1360/SSM-2020-0035

发表时间：2020

樊永显的其他基金

批准号：61762026

批准年份：2017

资助金额：38.00

项目类别：地区科学基金项目

相似国自然基金

基于深度学习方法预测蛋白质翻译后修饰位点

批准号：61762034

批准年份：2017

负责人：龙海侠

学科分类：F0213

资助金额：34.00

项目类别：地区科学基金项目

基于深度特征提取和匹配的多源时空遥感影像序列变化检测研究

批准号：61806164

批准年份：2018

负责人：苏临之

学科分类：F0604

资助金额：26.00

项目类别：青年科学基金项目

面向特征提取的深度鉴别稀疏表示学习方法研究

批准号：61806098

批准年份：2018

负责人：常合友

学科分类：F0605

资助金额：22.00

项目类别：青年科学基金项目

面向蛋白质功能预测的多标记学习方法研究与应用

批准号：61402378

批准年份：2014

负责人：余国先

学科分类：F0213

资助金额：26.00

项目类别：青年科学基金项目

面向蛋白质分子位点标记的多源特征提取和深度序列学习方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

萃取过程中微观到宏观的多尺度超分子组装 --离子液体的特异性功能

药食兼用真菌蛹虫草的液体发酵培养条件优化

非牛顿流体剪切稀化特性的分子动力学模拟

2009 -2017年太湖湖泛发生特征及其影响因素

现代优化理论与应用

樊永显的其他基金

基于多模态深度学习的lncRNA-RNA相互作用模式分析及预测研究

相似国自然基金