Protein-protein/ligand interactions and the relationship between the formed complex structures and their functions are very important in protein scientific researches. Effective computation and prediction of the complex structures and conformational changes in their interactions will have important significance for revealing the biological functions of super-big protein molecular systems. Developments of life science urgently require the deep studies of the computational principles and methods of multi-body protein complex structures and their functional conformational changes, and more efficient computational method developments. At the same time, as experimental data continues to grow rapidly, the role of new methods in big data sciences is becoming increasingly important. We will use deep learning methods to explore and integrate the bid data in protein interactions, to build a sound multi-body protein interaction database, expand the existing success of the two-body protein-protein interactions binding site prediction and complex structure prediction methods, and then develop new algorithms for conformational change studies of multi-body protein complex structures. Our studies will help to explore and provides an important theoretical basis for understanding the molecular mechanisms of major diseases, rational drug development, novel functional protein designs.
蛋白质与蛋白质、配体等分子的相互作用以及它们相互作用形成的复合物结构与功能的关系是蛋白质科学研究的重要内容。有效计算和预测它们相互作用形成的复合物结构和构象变化,对于揭示超大蛋白质分子体系的生物学功能等具有重要的意义。生命科学的发展迫切需要我们深入开展多体蛋白质复合物结构及其功能性变构的计算原理和方法研究,发展更高效的计算方法。同时,实验数据持续快速增长,新的大数据科学方法在生命科学中的作用越来越重要。我们将利用深度学习方法来挖掘并整合蛋白质相互作用的大数据,构建完善的多体蛋白质相互作用数据库,拓展已有成功基础的两体蛋白质-蛋白质相互作用的结合位点预测、复合物结构预测等方法,开发新的多体蛋白质复合物结构的构象变化算法。我们的研究将为探讨重大疾病产生的分子机制、合理的药物开发、新型功能蛋白质设计等提供重要的理论基础。
用深度学习方法研究多体蛋白质相互作用的氨基酸界面配对和复合物结构,是蛋白质科学研究的重要内容。有效计算和预测它们相互作用形成的界面配对和复合物结构,对于揭示超大蛋白质分子体系的生物学功能等具有重要意义。生命科学的发展迫切需要我们深入开展多体蛋白质复合物结构及其功能性变构的计算原理和方法研究,发展更高效的计算方法。同时,实验数据持续快速增长,新的大数据科学方法在生命科学中的作用越来越重要。我们利用深度学习方法来挖掘并整合蛋白质相互作用的大数据,构建完善的多体蛋白质相互作用数据集,拓展已有成功基础的两体蛋白质-蛋白质相互作用的结合位点预测、复合物结构预测等方法,开发新的多体蛋白质复合物结构预测算法。搭建了基于LSTM架构的深度学习计算环境,收集整理了两体、三体、四体等至多28条蛋白质链组成的多体蛋白质-蛋白质复合物的相互作用实验数据,摸索和训练了深度学习方法在多体蛋白质-蛋白质相互作用大数据上的模型和参数。分析了蛋白质相互作用的结构和动力学性质,挖掘了新的特征参数来描述蛋白质相互作用和预测蛋白质结合位点。结合新发现的蛋白质复合物界面的特征,进一步构建了五维空间方法来预测蛋白质结合位点氨基酸。比较分析了多种机器学习方法在不同类别蛋白质上预测相互作用的区别性能,创新性的提出了机器学习方法对蛋白质类型的选择性。开发了新的三体和四体蛋白质相互作用复合物界面氨基酸配对预测算法,包括SVM机器学习方法和图卷积网络的深度学习方法。针对多体超大蛋白质复合物结构解析时的冷冻电镜图像,开发了去噪和挑点两项新计算方法,可以帮助提高结构解析。整个课题按照计划认真执行,开发了多体蛋白质相互作用的深度学习算法,并应用到了生物实验中。完成了研究目标,发表了23篇相关学术论文,相关新算法的代码和数据都可公开使用。我们的研究将为探讨重大疾病产生的分子机制、合理的药物开发、新型功能蛋白质设计等提供重要的理论基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
基于LASSO-SVMR模型城市生活需水量的预测
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
面向蛋白质分子位点标记的多源特征提取和深度序列学习方法研究
基于图结构的数据表示和深度学习方法
基于深度学习方法预测蛋白质翻译后修饰位点
蛋白质相互作用预测的集成学习方法研究