蛋白质-配体绑定区域预测的特征抽取及学习算法研究

基本信息

批准号：61373062

项目类别：面上项目

资助金额：75.00

负责人：於东军

学科分类：

依托单位：南京理工大学

批准年份：2013

结题年份：2017

起止时间：2014-01-01 - 2017-12-31

项目状态：已结题

项目参与者：刘传才,严慧,吴月芳,王欢,陆彦婷,崔衍,周崇波,胡俊,李强

关键词：

多视角特征抽取蛋白质配体绑定绑定区域预测增量式学习可解释性模型

结项摘要

Protein-ligand interactions are ubiquitous and play important roles in a wide variety of biological processes. Accurately identifying the protein-ligand binding sites or pockets is of significant importance for understanding the protein function, analyzing the relationship between biological molecules, and instructing drug design etc. With the rapid development of protein sequencing technology, huge volumes of protein complexes have been generated in the post-genomic era and will continue to grow exponentially. It is highly desired to develop intelligent automatic methods for protein-ligand binding site prediction. In this study, we will systematically carry out research on feature extraction level and decision model level, respectively, for protein-ligand prediction based on the thorough evaluation on the shortcomings and bottlenecks of the existing prediction models. Contents of the research consist of protein evolution image sparse representation, protein multi-view feature dissimilarity analysis and extraction, ligand-specific prediction model, incremental prediction model, and interpretable prediction model. We expect to research and develop effective machine learning theory and algorithms for meeting the urgent demands of protein data analysis and processing from proteomics. Also, we will provide theoretically-sound, practically-good and highly interpretable protein computational models for biologists and general users. Our research will enrich the contents of protein computation, speed up the process of unveiling the relationship between protein sequence, structure and function, and further accelerate the development of bioinformatics.

蛋白质与其他生物分子(配体)之间的互相作用在生命过程中普遍存在并且不可或缺。准确识别出蛋白质与配体之间的相互作用区域，对于理解蛋白质的功能、分析生物分子之间的相互关系、指导药物设计等具有重要的指导意义。随着蛋白质数据的海量呈现，研发高效可靠的智能方法来进行蛋白质-配体绑定区域预测成为迫切需要。本项目在分析现有预测模型存在不足和瓶颈的基础上，从特征抽取和模型学习算法两个层面展开系统研究，以进一步提高蛋白质-配体绑定预测方法的可靠性和可用性。具体研究内容包括：蛋白质进化图象的稀疏特征抽取、蛋白质多视角特征差异性分析及抽取、配体特异性预测模型、增量式预测模型以及可解释性预测模型。本研究旨在为生物学及相关研究人员提供理论依据充分、实用性强、具有良好可解释性的应用系统，亦是对蛋白质生物计算领域的丰富与发展，有助于进一步推动生物信息学的发展。

项目摘要

蛋白质通过绑定位点、区域等形式与配体之间产生相互作用，这些相互作用在生命活动中是广泛存在且不可或缺的。精确地识别蛋白质与配体之间的绑定位点及区域，对于理解蛋白质的功能、分析生物分子之间的相互关系、药物设计等具有重要的指导意义。随着蛋白质数据的海量呈现及持续增长，蛋白质大数据时代已然到来。在大数据时代下，研发智能高效的蛋白质-配体绑定区域预测方法是十分有必要的。.本项目完成了基于多视角特征学习的配体绑定位点模型、基于类不平衡学习的配体绑定位点模型、基于海量蛋白质数据分析的配体绑定位点预测模型以及基于多标签学习算法的配体绑定位点预测模型的学习与构建；发表相关SCI/SCIE期刊论文20篇、国际会议论文2篇；授权国家发明专利4项及软件著作权4项。上述研究成果进一步地提高蛋白质-配体绑定预测方法的可靠性和实用性。为了便于实际应用，本项目为生物学及相关研究人员提供了理论依据充分、实用性强、交互性良好的应用服务系统。本项目是对蛋白质生物计算领域的丰富，有助于进一步推动生物信息学的发展。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：

发表时间：2016

DOI：10.3788/CJL201946.0801003

发表时间：2019

於东军的其他基金

批准号：61772273

批准年份：2017

资助金额：61.00

项目类别：面上项目

相似国自然基金

蛋白质翻译后修饰位点物种特异性预测的特征抽取和学习算法研究

批准号：61403077

批准年份：2014

负责人：赵晓威

学科分类：F0603

资助金额：25.00

项目类别：青年科学基金项目

海量多源互补蛋白质数据的配体绑定位点预测研究

批准号：61902352

批准年份：2019

负责人：胡俊

学科分类：F0213

资助金额：27.00

项目类别：青年科学基金项目

天然无序蛋白质无序区域及其分子识别特征域的预测算法研究

批准号：61602280

批准年份：2016

负责人：方春

学科分类：F0213

资助金额：20.00

项目类别：青年科学基金项目

基于几何算法与机器学习的反向配体结合位点预测

批准号：11301286

批准年份：2013

负责人：王奎

学科分类：A0604

资助金额：22.00

项目类别：青年科学基金项目

蛋白质-配体绑定区域预测的特征抽取及学习算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于MCPF算法的列车组合定位应用研究

基于腔内级联变频的0.63μm波段多波长激光器

於东军的其他基金

大规模多源异质蛋白质数据挖掘中的若干关键问题研究

相似国自然基金