Protein-protien interactions are formed as the combination results of many factors under the different biological environments. Understanding the mechanism of differential expression and cooperation of interaction-related features is one of the most important topics in current proteomics research. Based on the protein structure-function relationship, this project will extract the common features from different protein properties which related to interaction by using association ananlysis method, and represent protein in the level of amino acid residues. The difference of interactions with different types will be inverstigated and measured by the weight change in a Bayesian model. The function coupling and cooperation of the properties will be involved into a robust predictor which will be constructed using a optimized selection and combination method of kenerl functions. The preditor will be modified by the change of protein physical properties before and after the formation of interaction. Finally a reasonable criterion will be designed to evalute the prediction results. The purpose of this project is to inverstigate the differential expression and cooperation of protein properties deeply, and develop a high performance computational model to predict protein interface residues. The achievement of this project will provide theoratical support for understanding protein functions, recognizing key proteins of dieases, and improving drug design.
蛋白质相互作用的形成是诸多因素在相应生理环境中综合作用结果,揭示各种相关属性之间差异表达和协同作用机制是当前蛋白质组学亟待解决的关键问题之一。本项目拟立足于蛋白质结构-功能关系,利用关联分析方法提取不同属性之间的共有特征,从残基水平上对蛋白质进行矢量化表达;研究不同类型相互作用的差异,使用贝叶斯权重变化来衡量各种蛋白质属性的差异表达;研究各种属性之间的功能耦合和协同作用,利用核函数优化选择组合方法构建具有良好鲁棒性的预测模型;同时考虑到相互作用发生前后的物理特征变化来进行模型修正;设计合理的评价准则来对预测结果的可靠性进行评价。本课题旨在深入研究各种蛋白质属性的差异表达和协同作用对蛋白质结合面形成的影响,在此基础上构建多特征表达的高性能计算模型预测结合面残基,从而为理解蛋白质功能、确定疾病的关键蛋白、提高药物设计的针对性提供理论依据。
本项目已经按照制定的研究计划进行。本项目为期一年,上半年完成了蛋白质结合面残基数据源的获取、数据预处理和特征提取研究。下半年基于上半年的研究,完成了对蛋白质结合面特征差异表达和协同作用的研究,建立了针对蛋白质结合面残基预测的预测模型,并通过大量的模拟实验进行深入的验证和比较,并得到了性能较为满意的预测结果。本项目主要在数据源的获取、数据预处理、特征提取和分类预测方面进行了深入研究,主要成果包括1)提出了一种基于空间映射的蛋白质结合面残基预测的数据重构策略,以获得更高质量的数据源,实验结果表明我们在重构数据集上获得了较高的结合面残基预测性能,即0.78的预测准确率、75%的灵敏度和80%的特异度;2)提出了一种新的PCA-EELM的蛋白质相互作用预测模型,我们的方法在Saccharomyces cerevisiae的蛋白质相互作用数据中获得了87%的预测精度、86.15%的灵敏度和87%的特异度;3)我们提出了一个基于最小二乘支撑向量回归(LS-SVR)回归模型的蛋白质多肽离子漂移时间的预测模型,我们的预测模型能够针对不同带电电荷的蛋白质多肽的离子漂移时间进行预测。在本项目的资助下,本项目课题组公开发表了高水平的学术论文7篇(其中SCI检索的国际期刊4篇,EI检索的国际学术会议2篇),另外已录用的SCI国际期刊论文3篇。所发表的SCI期刊论文影响因子都超过1.0,最高影响因子3.08。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
中国参与全球价值链的环境效应分析
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于氨基酸序列协同进化编码的蛋白质热点残基预测
基于蛋白质分类和残基定义优化的蛋白质-蛋白质相互作用位点预测
基于结构的DNA结合蛋白结合残基预测及结合特异性分析
蛋白质残基间相互作用预测算法研究及其在三级结构预测中的应用