Proteins are important macromolecules in cells. They perform their biological function through interaction with ligands. Therefore, the prediction of protein-ligand binding sites can offer valuable clues for protein functional studies. In general, the methods for the prediction of protein-ligand binding sites can be divided into two groups: template-based predictors and ab-initio predictors. These methods have the following disadvantages. Template-based predictors do not work well when homologous templates are not recognized; while ab-initio predictors only work for several special kinds of ligands. In this project, we will use the structure and sequence information to develop new methods for protein-ligand binding sites prediction, aiming to solve the problems of current methods. The study includes three major aspects. 1) Perform statistical and clustering analysis on existing ligands. Using the sequence evolutionary information, develop a new ab-initio predictor for the frequently occurring ligands, solving the limitation of current ab-initio predictors. 2) Develop a new algorithm for local structure alignment and combine it with global structure alignment to improve the coverage of template recognition, reducing the failure rate of template-based predictors. 3) Investigate the best way to combine multiple predictors by systematic analysis of existing prediction results. Based on the result of this investigation, develop a meta-algorithm for the prediction of protein-ligand binding sites.
蛋白质是细胞中重要的生物大分子,它们通过与配体的相互作用来执行其生物学功能。因此对蛋白质-配体结合位点的预测能为研究蛋白质功能提供重要依据。蛋白质-配体结合位点的预测方法主要包括基于模板的预测方法和从头预测方法。这两类方法都存在弊端。其中,基于模板的预测方法在未识别出同源模板的情况下基本失效;而从头预测方法只能适用于少数几类特殊的配体。本项目通过利用结构与序列信息,开发新的蛋白质-配体结合位点的预测方法,以解决现有方法的弊端。这主要包括以下三个方面的研究:1)对现有配体进行统计与聚类分析,并利用序列进化信息,对出现频率较高的配体开发相应的从头预测算法;2)开发局部结构比对算法,通过与全局结构比对的结合来提高模板识别的覆盖率,以降低基于模板的预测方法失效的概率;3)通过对大量预测结果的系统分析,探究综合多种方法的最优方案。据此建立一个用于蛋白质-配体结合位点预测的综合算法。
蛋白质-配体相互作用是蛋白质生物学功能的一个重要方面,预测蛋白质-配体结合位点为药物设计等领域提供了重要的信息。本项目利用蛋白质结构与序列信息,围绕蛋白质-配体结合位点预测这一主题开展了一系列工作,取得了重要的研究成果。主要包括:(1)针对不同的配体类型与特征,开发了CoABind、NucBind、PepBind等多个从头预测方法,分别用于预测辅酶A、核酸和多肽的结合位点。(2)开发了基于模板和分子对接方法的蛋白质-配体结合位点预测算法COACH-D。(3)开发了蛋白质结构数据库的快速搜索算法及多重蛋白质结构比对算法mTM-align。. 通过本项目的研究,在Nucleic Acids Research(2篇)和Bioinformatics(7篇)等期刊发表了15篇SCI期刊论文以及Wiley出版社系列丛书的一章。所发表的论文期刊累计影响因子94.52。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
基于LASSO-SVMR模型城市生活需水量的预测
内点最大化与冗余点控制的小型无人机遥感图像配准
基于多模态信息特征融合的犯罪预测算法研究
氯盐环境下钢筋混凝土梁的黏结试验研究
基于几何算法与机器学习的反向配体结合位点预测
高通量核酸、配体、蛋白质结合位点的差异性分析与特异化预测
基于DNA序列、结构及表观遗传信息的酵母复制起始位点的预测与实验研究
基于三维结构信息预测蛋白质相互作用及其位点的计算研究