Identify potential persistent organic pollutants (POPs) and persistent bioaccumulative toxic substances (PBTs) from mainstream industrial chemicals is essential for chemical risk assessment, management, and pollutant control. With the domestic industry moving towards the upstream of the industrial chain, China will gradually become the center of R&D, production, and usage of newly synthetic chemicals. However, most current researches in the field of environmental chemistry are focused on known POPs / PBTs, and the identification and recognition of new POPs / PBTs are still in the state of following the western countries. Thus, it is necessary to develop new identification methods for POPs / PBTs control in order to fulfill the international management and control commitment of POPs / PBTs and protect the domestic ecological environment and public health. In the proposed study, a deep residual network is introduced to develop an 'in-silico' modeling method for POPs/PBTs identification. By using QSAR/QSPR theory, complex chemical spatial structure and element composition information is transformed into quantitative data information through molecular descriptors, and the combination and functional relationship of different molecular descriptors are examined through deep residual neural network to find structural characteristics related to POPs / PBTs attributes, and then utilizes these learned features identify potential new POPs / PBTs in the domestic industrial chemical inventory.
识别主流工业化学品中的潜在持久性有机污染物(POPs)和持久性可生物累积毒性化学品(PBTs),对化学品风险评估、管理和污染控制有着至关重要的意义。随着国内工业体系不断向产业链上游移动,中国逐渐成为新型化学品的研发、生产与使用中心。然而,目前国内环境化学领域绝大部分研究均围绕已知的POPs/PBTs展开,对于新型POPs/PBTs的鉴定和识别研究尚处于跟随欧美发达国家的状态。为了更有效的履行我国对POPs/PBTs的国际管控承诺,保护国内生态环境及人口健康,有必要开发新型POPs/PBTs的鉴定与识别方法。本研究依据定量-构效理论,将复杂的化学品空间及元素组成信息通过分子描述符转化为量化数据信息,运用深度残差神经网络对不同的分子描述符的组合与函数关系进行深度数据挖掘,寻找与POPs/PBTs属性相关的化学品结构特征,进而鉴定和识别潜在的新型POPs/PBTs。
识别主流工业化学品中的潜在持久性有机污染物(POPs)和持久性可生物累积毒性化学品(PBTs),对化学品风险评估、管理和污染控制有着至关重要的意义。然而,目前国内环境化学领域绝大部分研究均围绕已知的POPs/PBTs展开,对于新型POPs/PBTs的鉴定和识别研究尚处于跟随欧美发达国家的状态。为了更有效的履行我国对POPs/PBTs的国际管控承诺,保护国内生态环境及人口健康,本研究依据定量-构效理论,将复杂的化学品空间及元素组成信息通过分子描述符转化为量化数据信息,运用深度残差神经网络对不同的分子描述符的组合与函数关系进行深度数据挖掘,寻找与POPs/PBTs属性相关的化学品结构特征,进而鉴定和识别潜在的新型POPs/PBTs。本研究首先构建了包含111852种有机化合物的数据库。参考斯德哥尔摩公约、欧盟PBTs清单,以及相关文献研究成果,对其中11299种化合物进行了辨识和标记。其中包含1309种POPs/PBTs及9990种非POPs/PBTs类化合物。运用化学品结构特征运算软件,分析量化化学品的分子结构特征,最终选定2424个有效分子描述符用于组成供神经网络模型学习的数字化分子结构特征。通过引入残差神经网络这一深度学习中的最新科研成果,开发了全新的识别持久性有机污染物及持久性可生物富集有毒化学品(POPs/PBTs)的快速识别模型。该模型对于有机化合物中POPs/PBTs的识别准确率超过95%,其整体鉴定精度、适用范围、以及可靠性均远高于同类研究模型。从上述数据库中初步筛选出了4011种疑似POPs/PBTs类化合物。与此同时,我们通过引入梯度加权类激活映射技术以及导向-反向传播(Grad-CAM)技术,建立了分子空间结构特征与持久性、毒性、以及生物富集能力等化合物特定物理化学性质之间的非线性关系,为潜在新型环境污染物的快速筛查和鉴定提供了全新的思路和途径。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
持久性有机污染物的超分子识别及其可生物利用性研究
典型亚热带海湾持久性有机污染物(POPs)的生物累积动力学
纳米颗粒与持久性有机污染物的复合毒性及其机理研究
极地地区新型持久性有机污染物生物富集机制与环境效应研究