融合多视角3D深度描述子的靶蛋白-配体复合物活性预测研究

基本信息

批准号：61802057

项目类别：青年科学基金项目

资助金额：26.00

负责人：何飞

学科分类：

依托单位：东北师范大学

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：赵晓威,孙平平,杨焕,宫健婷,陈泳冰,郭思佳,张恩聚

关键词：

深度胶囊网络虚拟筛选复合物活性预测动态路由深度卷积网络

结项摘要

Virtual screening is to select the most promising ligands as lead compounds via molecule docking, which may speed up drug design and reduce costs of drug development dramatically. The key of virtual screening is to accurately predict the targeted protein-ligand compound activity based on the conformation from molecule docking. The early predict methods based on biochemical empirical equations have the disadvantages of low precision and generalization. And in the machine learning models, their prior knowledge-based feature sets are difficult to describe the details in spatial structures. These seriously restrict the development of prediction effect. In this research, we plan to construct a deep learning network for targeted protein-ligand compound activity prediction, which will learn the new features from multiple 3D biochemical structural encoding of compound conformations, and adaptively generate multi-viewed 3D deep descriptors embedding abundant structural and biochemical properties. In such network, the 3D deep descriptors from different degree of freedom system will be combined to conduct the targeted protein-ligand compound activity prediction. At the same time, we also present the strategy of reliable negative sample extraction, and the training trick for imbalanced training samples. Based on the above work, we may expect to build a prediction model with high precision and generalized performance. Our research may provide a good deal of insight into the mechanism of interaction between targeted protein and ligand, and strong support for the development of virtual screening. Therefore, it has both the theoretical research significance and practical value.

虚拟筛选通过分子对接技术，挑选最有希望与靶蛋白结合的配体作为先导化合物，能够大幅加快新药研发速度，降低药物研发成本。根据分子对接产生的构象，准确预测靶蛋白-配体复合物活性是虚拟筛选的关键。早期根据生化经验方程打分的预测方法存在精度不高、通用性低的缺陷；基于机器学习的预测方法中，特征集合依赖专家知识构造，并且难以精准表达空间结构细节，制约其预测效果的提升。本项目拟构建面向靶蛋白-配体复合物活性预测的深度学习网络，对复合物构象的多种3D生化结构编码进行特征学习，自适应生成蕴含丰富结构特性和生化性质的多视角3D深度描述子，并融合多自由度体系下3D深度描述子实现联合预测；同时，提出可靠负样本筛选策略，以及针对不平衡数据的网络训练方法，从而打造高精度、泛化能力强的预测模型。本项目的研究有助于深入理解靶标蛋白质与配体间相互作用机制，对虚拟筛选领域的发展提供有力支撑，具有重要的理论研究价值和现实意义。

项目摘要

在药物开发领域，研发疾病靶蛋白与配体复合物的活性预测工具，有助于深入理解靶标蛋白质与配体化合物相互作用机制，为潜在药物分子筛选提供信息来源和决策支持。本项目目标是构建面向靶白-配体复合物活性预测的深度学习网络，研究内容包括：（1）建立多视角3D深度描述子生成网络；（2）研究融合不同自由度体系下3D深度描述子的Capsule网络；（3）提出深度学习网络在不平衡样本分布下的训练策略。针对这些任务，本项目主要研究结果为：（1）提出基于多视角抽取描述时空特异蛋白质交互特征，实现多视角3D深度描述子生成网络。该模型采用多子网并行的方式从原始蛋白质结构及理化属性两类特征描述符中学习3D深度描述子，并利用集成学习策略整合多视角深度表示；（2）构建capsule深度学习网络的蛋白质-配体复合物候选构象的评估方法，利用图卷积运算的消息传输机制，从蛋白质-配体复合物分子结构中，提取各残基相互作用和拓扑信息，筛选高质量的蛋白质-配体复合物结合构象；（3）利用随机欠采样策略和Boostrap采样策略，避免不平衡数据给以上网络模型带来偏向性。运用本项目的核心技术，我们在多个生物信息学相关问题进行研究，取得的成果包括：（1）设计RetinaNet网络自动从生物医学文献自动识别pathway通路图的基因实体和关系，进而运用该方法挖掘精神疾病文献中基因组和蛋白组学信息；（2）设计DMCTOP网络模型同时预测靶蛋白全链拓扑结构和N末端朝向；（3）设计IMPContact网络模型预测靶蛋白helical交互残基和靶蛋白-配体结合位点；（4）设计TM-ZC网络模型预测膜蛋白helical折叠的残基Z坐标，为靶蛋白的结构预测和功能注释和提供新视角。在本项目支持下，项目组共发表论文18篇，其中被SCI检索14篇，在CCF推荐国际会议上发表论文3篇；获授权专利1项，获授予软件著作权1项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：

发表时间：2016

DOI：10.3969/j.issn.1004-132X.2020.03.001

发表时间：2020

DOI：10.3969/j.issn.1674-0696.2020.10.20

发表时间：2020

何飞的其他基金

批准号：81100699

批准年份：2011

资助金额：14.00

项目类别：青年科学基金项目

批准号：50802020

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：81403336

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：81300325

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：41204102

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：51504002

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：31460244

批准年份：2014

资助金额：47.00

项目类别：地区科学基金项目

批准号：51204018

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：11104294

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：41674155

批准年份：2016

资助金额：70.00

项目类别：面上项目

批准号：81371061

批准年份：2013

资助金额：70.00

项目类别：面上项目

相似国自然基金

基于食品蛋白—多配体复合物的活性成分载体的研究

批准号：31201291

批准年份：2012

负责人：梁丽

学科分类：C2002

资助金额：22.00

项目类别：青年科学基金项目

基于深度骨架模型的多模态多视角3D手势识别的研究

批准号：61702095

批准年份：2017

负责人：张宇

学科分类：F0605

资助金额：29.00

项目类别：青年科学基金项目

基于多视角深度特征融合的遥感视频运动目标检测跟踪

批准号：61902298

批准年份：2019

负责人：陈璞花

学科分类：F0210

资助金额：29.00

项目类别：青年科学基金项目

基于多模态融合以及深度神经网络的视频内容自然语言描述自动生成的研究

批准号：61772535

批准年份：2017

负责人：金琴

学科分类：F0209

资助金额：62.00

项目类别：面上项目

融合多视角3D深度描述子的靶蛋白-配体复合物活性预测研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

氧化应激与自噬

机电控制无级变速器执行机构动态响应特性仿真研究

含饱和非线性的主动悬架系统自适应控制

何飞的其他基金

ZNF644基因在高度近视发病机理中的作用研究

新型耐高温多层隔热结构的隔热机理分析及实验评价研究

基于JAK-STAT信号通路研究益气活血通络法干预COPD肺血管重构的分子机制

肝细胞和巨噬细胞特异性阻断Notch信号对肝纤维化的不同作用及其机制研究

月基极紫外图像重构磁赤道面等离子层顶

连铸坯与结晶器铜板粘结的形成、传播和修复机制及防控方法

骨损伤修复材料刚度参数对干细胞成骨行为的影响

基于核方法的冷轧带钢产品质量监控与诊断研究

飞秒激光时空域特性操控对激光材料处理空间选择分辨率的调控研究

亚极光区域电离层与等离子体层边界统计研究

ABCB6基因在眼缺损发病机制中的功能研究

相似国自然基金