Recognition of drug-target is of great significance to the research and development of innovative drugs, the new use of old drugs, the study of drug toxicity and individualized treatment. However, due to the effects of yield, precision, and cost, traditional experimental methods are difficult to widely use to infer these potential drug-target interactions. With the rapid development of computational biology, computer-aided drug target interaction prediction, as a fast and accurate drug target recognition method, provides a new idea for early targeting and cost saving. We intend to propose an algorithm based on deep learning algorithm, natural language processing technology and negative correlation ensemble theory to predict drug-target potential interaction using drug molecular fingerprint information and amino acid sequence information. First, develop new methods for representing drug molecules and amino acid sequences. Then, convolution neural network is used to extract various distributed feature maps from the original drug-target feature pairs. Next, these feature maps are divided into different groups and put into multiple fully connected networks. Finally, negative correlation learning theory is used to integrate multiple fully connected networks to predict drug-target interactions stably and accurately. This project research will provide high-reliability technical support and theoretical basis for targeted drug design.
药物靶标的识别对于创新药物的研发、老药新用、药物毒副作用研究及个体化治疗等领域都具有十分重要意义。然而,由于产量、精密度和成本的影响,传统的实验方法很难被广泛应用于推断这些潜在的药物-靶标相互作用。随着计算生物学的迅速发展,计算机辅助的药物-靶标相互作用预测方法作为一种快速而准确的药物靶标识别手段,为早期研发锁定目标、节约成本提供了新思路。本项目利用药物分子的拓扑结构及氨基酸序列信息,拟提出一种基于深度学习、自然语言处理以及负相关学习的算法来对药物-靶标潜在相互作用进行预测研究。首先,研究药物化合物分子及氨基酸序列的数值化表征新方法;然后,具有表征学习能力的深度学习算法被使用从数值化的药物-靶标对中提取分布式特征;最后,使用负相关集成神经网络来稳定、准确地预测药物-靶标间的相互作用。本项目研究将为靶向药物设计提供高可靠的技术支持和理论依据。
药物靶标的识别对于创新药物的研发、老药新用、药物毒副作用研究及个体化治疗等领域都具有十分重要意义。然而,由于产量、精密度和成本的影响,传统的实验方法很难被广泛应用于推断这些潜在的药物-靶标相互作用。随着计算生物学的迅速发展,计算机辅助的药物-靶标相互作用预测方法作为一种快速而准确的药物靶标识别手段,为早期研发锁定目标、节约成本提供了新思路。本项目利用药物分子的拓扑结构及氨基酸序列信息,提出了一种基于深度学习、自然语言处理以及负相关学习的算法来对药物-靶标潜在相互作用进行预测研究。主要研究内容如下:首先,研究了药物化合物分子及氨基酸序列的数值化表征新方法;然后,具有表征学习能力的深度学习算法被使用从数值化的药物-靶标对中提取分布式特征;最后,使用负相关集成神经网络来稳定、准确地预测药物-靶标间的相互作用。在本项目资金的支持下,经过三年来的持续努力,我们顺利的完成了预期的成果,得出了一些有启发意义的结论。首先,我们通过收集、整合多个药物和靶标的数据资源,清洗出了一个大规模的、标签可靠的药物靶标相互作用数据库,为产业界构建切实可用的药物靶标发现模型提供了数据基础。其次,我们提出并改进了一系列基于图卷积的药物化合物原子级特征表示学习方法,我们验证了相比于传统的化合物指纹特征来说,原子级的表征能够为预测模型提供更为细粒度的化合物信息;我们还设计了一系列新的蛋白质靶标的表示方法,相比于先前的基于蛋白质序列的表示方法,我们新提出的方法除了能够提取到序列信息以外,还可以获取蛋白质的进化信息以及抽象的纹理信息。我们还提出了基于自适应学习的药物-靶标关系特征抽取方法以及基于层次化网络嵌入特征与负相关学习相结合的集成神经网络模型。在多方的经验性评估中,我们提出的这套系统在准确率、鲁棒性、泛化性以及可用性都是当前最顶尖的。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于图卷积网络的归纳式微博谣言检测新方法
一种改进的多目标正余弦优化算法
多源数据驱动CNN-GRU模型的公交客流量分类预测
基于深度学习的大规模网络视频拷贝检测方法
基于深度强化学习的新闻事件预测方法研究
基于CUDA异构平台的大规模高精度药物-靶标相互作用预测研究
自然语言处理中基于矩阵的结构化学习研究