基于深度学习方法预测蛋白质翻译后修饰位点

基本信息
批准号:61762034
项目类别:地区科学基金项目
资助金额:34.00
负责人:龙海侠
学科分类:
依托单位:海南师范大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李满枝,付海艳,王觅,赵志青,马翠花,修兴强,谢颖,李子嫣,胡丽霞
关键词:
修饰位点和类型蛋白质翻译后修饰卷积神经网络深度学习循环神经网络
结项摘要

Post-translational modifications (PTM) plays crucial roles in regulating protein activity, structure and function, also in prevention and treatment of human disease. Using the calculation method for predicting sites of PTM can make up traditional experiment consuming a lot of time, energy and money. The project will construct, train, verify and test deep learning models to quickly and accurately predict modified sites and types of PTM, which are based on convolutional neural network (CNN) and recurrent neural network (RNN) through respectively extending the hidden layers of CNN and RNN in space and time. In the process of prediction, the multiple convolutional layers of CNN can obtain high level features of sequences, and the multiple recurrent hidden layers fully consider the relations among amino acids. This project focus on the following problems in the process of research: (1) Dividing long sequences into short sequence; (2) Protein low-level feature extraction; (3) The depth and breadth of deep learning models; (4) The parameters optimization of deep learning models; (5) The loss and activation functions of deep learning models. We will develop web-server for the predictor based on the above research results. Identifying the modified sites of PTM has great significance for deep understanding multiple functions of proteins.

蛋白质翻译后修饰在调节蛋白质活性、结构与功能,预防与治疗人类疾病等方面具有重要作用。利用计算方法预测蛋白质翻译后修饰位点,可以弥补传统实验方法周期长、效率低和成本高等方面的不足。本项目基于深度学习中的卷积神经网络(CNN)和循环神经网络(RNN),分别将CNN和RNN的隐含层在空间和时间上扩展,构建、训练、验证、测试深度学习模型,实现快速、准确的预测被修饰位点的位置和类型。在预测过程中,CNN的多层卷积可获取序列高水平特征,RNN的多层循环隐含层可充分考虑序列中前后氨基酸的相关关系。项目研究过程中重点解决以下问题:(1) 蛋白质长序列划分成短序列;(2) 蛋白质低水平特征提取;(3) 深度学习模型的深度和广度;(4) 深度学习模型的参数最优化;(5) 深度学习模型中的损失函数和激活函数。根据以上研究成果开发在线服务平台。翻译后修饰位点的鉴定结果对于深入了解蛋白的多项生物功能具有重大意义。

项目摘要

蛋白质翻译后修饰在调节蛋白质活性、结构与功能,预防与治疗人类疾病等方面具有重要作用。利用计算方法预测蛋白质翻译后修饰位点,可以弥补传统实验方法周期长、效率低和成本高等方面的不足。本项目基于深度学习中的卷积神经网络(CNN)和循环神经网络(RNN),分别将CNN和RNN的隐含层在空间和时间上扩展,构建、训练、验证、测试深度学习模型,实现快速、准确的预测被修饰位点的位置和类型。在预测过程中,CNN的多层卷积可获取序列高水平特征,RNN的多层循环隐含层可充分考虑序列中前后氨基酸的相关关系。项目研究过程中重点解决了以下问题:(1) 基于深度学习模型预测了蛋白质磷酸化位点;(2) 基于深度学习模型预测了蛋白质羟基化位点;(3) 得出了深度学习模型最优的架构和最优参数用于蛋白质翻译后修饰位点的预测;(4) 基于CNNN和RNN的结构研究了进一步图神经网络(GNN);(5) 研究了蛋白质结构的变异和疾病之间的关联;(6)基于项目驱动的方式进行人才培养。结果表明基于CNN和RNN的深度学习模型可以较好的预测蛋白质翻译后修饰羟基化和磷酸化位点,预测精度能够达到95%以上,在GPU和python集成开发环境下,预测速度较快;发现了序列相似性和基因差异性表达对序列的结构产生重要的影响。结构决定功能,研究序列相似性的目的之一是通过相似的序列得到相似的结构或相似的功能;通过对每一个基因在疾病中差异表达的测定,人们将能够找到新的方法来治疗和预防许多疾病,如癌症和心脏病等。翻译后修饰位点的鉴定结果对于深入了解蛋白的多项生物功能具有重大意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

氯盐环境下钢筋混凝土梁的黏结试验研究

氯盐环境下钢筋混凝土梁的黏结试验研究

DOI:10.3969/j.issn.1001-8360.2019.08.011
发表时间:2019
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

DOI:10.7506/spkx1002-6630-20190411-143
发表时间:2020

龙海侠的其他基金

相似国自然基金

1

基于多标签学习的蛋白质翻译后修饰位点预测

批准号:11671032
批准年份:2016
负责人:徐岩
学科分类:A0405
资助金额:48.00
项目类别:面上项目
2

基于机器学习的蛋白质翻译后修饰位点预测的研究

批准号:11301024
批准年份:2013
负责人:徐岩
学科分类:A0405
资助金额:22.00
项目类别:青年科学基金项目
3

Tau蛋白翻译后修饰位点预测与修饰机制研究

批准号:21175064
批准年份:2011
负责人:邱建丁
学科分类:B0310
资助金额:68.00
项目类别:面上项目
4

非平衡分类模式下的蛋白质翻译后修饰位点预测方法研究

批准号:61761023
批准年份:2017
负责人:贾建华
学科分类:F0124
资助金额:37.00
项目类别:地区科学基金项目