Deep learning techniques brings artificial neural networks back to its original goal: simulating the recognition, learning and thinking processes of human brain. Deep learning promotes the rapid development of artificial intelligence with it strong abilities of representation learning, big data and miltitask processing. In this study, we introduce deep learning into chemoinformatics. We plan to develop multitask deep recursive networks and multitask deep convolutional neural networks with direct topology or graph encoding of molecule structures as inputs, in order to qualitively and quantitatively predict the structure-property (toxicological properties as examples) relationships of chemical compounds. We will develop methods for direct topology or graph encoding of molecule structures which can exploit maximally the representation learning ability of deep learning. We will also predict various of toxicological properties of compounds simutanously within one multitask deep learning architecture. Our methods are expected to perform significently better and more generally applicable than previous single-task toxicological property prediction methods.
深度学习使人工神经网络回归了模拟人脑认知、学习和思维方式的原始目标,推动了人工智能的快速发展。深度学习具有强大的表征学习、大数据处理和多目标处理能力。本项目将深度学习方法引入化学信息学研究,研究适合于化学分子结构编码的多目标深度递归神经网络和多目标深度卷积神经网络,用于定性和定量预测化合物分子结构与性质(以毒理学性质为应用实例)之间的关系。我们将发展化学分子结构直接编码到神经网络中作为输入的方法,以最大发挥深度学习算法的表征学习能力;还将发展多种毒理学性质在多目标深度学习框架下同时进行计算和预测的方法,以突破以往对化合物毒理学性质单独研究、单独预测的状态,预期可以显著提高预测的准确性和模型的泛化能力。
深度学习方法已经在化学信息学研究中发挥着越来越重要的作用。 本项目使用深度学习方法研究适合于化学分子结构编码,用于定性和定量预测化合物分子结构与性质之间的关系。发展了多种化合物性质在多目标深度学习框架下同时进行计算和预测的方法,以提高预测的准确性和模型的泛化能力。本项目发展了MGE-CNN 框架,是一种通用的可以对化合物的多个化学性质进行预测的框架,我们将 MGE-CNN 用于化合物口服急性毒性(AOT)预测,可以解释化合物片断结构与性质之间的对应关系; 发展了一种多目标堆积自编码深度学习模型,利用深度神经网络同时计算预测化合物对五种P450亚型的抑制性,该预测模型比现有的预测方法具有更好的准确度和稳健性;使用人工智能自然语言处理技术 Transformer 与化学信息语言编码交叉,基于端对端策略发展了只需要输入目标产物分子,就能预测出产物到前体的单步逆合成分析方法,在单步逆合成反应预测中获得了很好的准确率;本项目还将深度学习方法应用于蛋白质序列和功能关系的研究,发展了基于序列的蛋白质-蛋白质相互作用深度学习预测方法DL-PPI以及基于蛋白质序列Word2Vec编码的可药性靶标预测方法DL-Target,DL-PPI和DL-Target与传统同类方法相比,其预测外部数据的准确性得到了较大的提高,相关工作展示了深度学习在基于序列的蛋白质功能预测的潜力,引起广泛关注和跟踪研究。本项目共发表相关论文10篇,申请软件著作权1项,项目负责人在国内外学术会议上受邀作与项目相关的报告13次,建立网络在线计算服务器3个,国内外总访问量超过25,000次。依托本项目的研究成果,项目负责人2019年获得中国化学会计算机化学专业委员会第二届“青年计算化学家奖”和第十三届“药明康德生命化学研究奖”学者奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于图卷积网络的归纳式微博谣言检测新方法
一种改进的多目标正余弦优化算法
生物炭用量对东北黑土理化性质和溶解有机质特性的影响
广度自适应的深度迁移度量学习方法及其在复杂机械设备故障诊断与预测中的应用研究
时空深度学习方法与应用
新型进化计算与深度学习方法及其在疾病预防与控制的应用
深度弹性凸包网络及其在大型旋转机械剩余寿命预测中的应用