The luciferase reporter assays derived from bioluminescence technique, which is one of the most appealing tool for the alternatives to animal testing, has been widely used in environmental science, chemistry and medical science. However, many researches show that direct inhibition of the luciferase enzyme rather than cell signaling pathways by a substance would result in false positives in a reporter gene assay. Therefore, the potential luciferase inhibitors should be recognized and evaluated..Testing all inhibitors by experiment is difficult or even impossible. In this project, we will constructe a computational model to distinguish and filter out potential luciferase inhibitors within the framework of ensemble learning. The data of inhibitors and non-inhibitors come from quantitative high-throughput screening. The molecular interaction energy components (MIECs) are built by binding free energy decomposition of MM/GBSA. Then, a Gradient Boost Decision Tree classifier is constructd based on MIECs to screen inhibitors from non-inhibitors. Next, Automatic analysis of poses using self-organizing maps (AuPosSOM) method are uesd to class inhibitors into different binding mode group. Then, a QSAR model between MIECs of inhibitors and median effective concentration (EC50) is built by Random Forest. Models resulting from this project will enable filter the luciferase inhibitors in luciferase-reporter gene assay and evaluate its toxicity effect.
基于荧光素酶报告系统的发光技术是一种重要的体外实验方法,已在环境科学、化学和医药学等领域广泛应用。然而研究表明:外源污染物如荧光素酶抑制剂对酶发光体系的毒性效应,会导致针对靶标或信号通路的实验结果出现假阳性。因此,识别荧光素酶抑制剂并评估其效应,对准确分析细胞毒性或信号通路具有十分重要的意义。.生物实验测试化合物耗时且昂贵。本项目拟在集成学习框架下基于结合自由能建立荧光素酶抑制剂预测模型。首先以生物实验测定的数十万个化合物对荧光素酶效应数据为基础,通过MM/GBSA结合自由能分解建立化合物的分子相互作用能谱矩阵(MIEC);然后基于MIEC,采用梯度提升决策树建立高精度的抑制剂与非抑制剂分类模型;进一步利用自组织映射分析法对不同结合模式的抑制剂进行聚类,采用随机森林建立抑制剂的MIEC与半数效应浓度之间的定量构效关系模型。本项目所构建模型极有望有效识别荧光素酶报告基因实验中潜在的酶抑制剂。
研究表明部分外源污染物会对基于荧光素酶报告系统的发光体系本身产生毒性效应,导致针对靶标或信号通路的实验结果出现假阳性,如内分泌干扰物的体外筛选实验等。因此,识别荧光素酶抑制剂并评估其效应,对准确分析细胞毒性或信号通路具有十分重要的意义。本项目以定量高通量筛选实验获得的数十万个化合物的效应数据为基础,通过多种计算毒理学方法,构建了荧光素酶抑制剂和非抑制剂预测模型。项目构建了不同精度和速度的预测模型:1) 基于相互作用能矩阵的分类预测模型(简写为MIEC-GBDT)。基于30个残基的Evdw, Eele, GGB, GSA构建的MIEC-GBDT模型对测试集中的抑制剂和非抑制剂的预测准确性分别为87.2%和90.3%。2) 基于受体相互作用模式的分类预测模型(简写为IP-GBDT)。IP-GBDT分类模型对测试集中的抑制剂和非抑制剂的预测精度分别为86.5%和86.3%。该方法相比于MIEC-GBDT损失了一部分预测准确性,但计算速度显著快于MIEC-GBDT模型。3) 整合分子描述符和分子指纹的高通量虚拟筛选模型(简写为MPF-Bayesian)。MPF-Bayesian对平衡数据集(1:1)的抑制剂的预测准确度为90.6%,非抑制剂的预测准确性为92.0%;对不平衡数据集(1:10)的抑制剂的预测准确度为90.8%,非抑制剂的预测准确性为91.1%。该模型虽然损失了小分子与荧光素酶相互作用信息使得抑制机理不清楚,但是由于很快的计算速度和对不平衡数据集的准确预测,该方法适用于荧光素酶抑制剂的高通量虚拟筛选。4) 基于相互作用能矩阵的抑制剂pEC50定量预测模型(简写为MIEC-Q)。MIEC-Q模型根据配体-受体结合模式聚类,采用随机森林法基于特征能量矢量矩阵(MIEC),实现了对抑制剂pEC50的定量预测。项目成果已发表论文4篇,其中SCI收录3篇,会议论文1篇。另在审稿论文1篇,在撰写论文1篇。培养博士生2名,硕士生1名,本科生2名。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
转录组与代谢联合解析红花槭叶片中青素苷变化机制
钢筋混凝土带翼缘剪力墙破坏机理研究
集成学习框架下的DNA启动子分类及其甲基化预测研究
集成学习框架下的蛋白质-蛋白质结合位点预测方法研究
模拟酶荧光素抑制剂的筛选及分析应用研究
大数据构架下模式辨识和集成学习的制冷空调故障诊断方法研究