集成学习框架下的蛋白质-蛋白质结合位点预测方法研究

基本信息
批准号:61261027
项目类别:地区科学基金项目
资助金额:45.00
负责人:贾建华
学科分类:
依托单位:景德镇陶瓷大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:王普,林卫中,吴志诚,邱望仁,闵建亮,赵丽萍,周凤麟,李慧文
关键词:
蛋白质序列生物计算集成学习结合位点混沌游戏表示图
结项摘要

Research on the struture,function and localization information of protein has become a hot-spot in biology information field. Prediction of protein-protein binding site is important to pharmacology.The protentail target of drug can be detected via prediction of binding site. But it is high cost, long span and even hard to some current techology for biological experimental approaches.However, with the development of information technology, it is accessible to this problem by machine learning methods. The prediction of protein-protein binding site is a typical classification of imbalance dataset. The project exploits the advantage of ensemble learning such as novelty,good generalization,combining with the imbalance resample technique and selection strategy, to engender the diverse and accurate component learners used by ensemble learning via utilizing sequence features and structure features of protein.It is possible to further impove the prediction accuracy of protein-protein binding site based on the proposed method.The proposed model will be significative for computer-aided drug discovery to some extent.

研究蛋白质功能、结构和定位信息已经成为生物信息学的一个研究热点,其中蛋白质-蛋白质结合位点的预测对于药理学具有重大意义,通过预测结合位点可以为药物设计找到准确的靶点。但是通过生物实验的方法确定结合位点除了受本身的技术限制之外,往往成本较高,且费时费力。随着信息技术的发展,使得基于机器学习的方法成为可能。蛋白质-蛋白质结合位点预测是一个典型的非平衡数据集的分类问题。本项目利用机器学习中集成学习算法鲁棒性强,泛化能力好的优点,利用非平衡采样技巧和选择性集成策略,融合蛋白质的序列特征和结构特征,构造具有一定差异性和准确性的集成学习所需个体,从而进一步提高蛋白质-蛋白质结合位点预测精度。此概念模型对于计算机辅助药物设计具有一定的指导意义。

项目摘要

项目基于蛋白质的物理化学特性和氨基酸的统计特性,在集成学习框架下对蛋白质交互和结合位点进行预测。在此基础了对蛋白质功能位点特别是翻译后修饰位点预测进行了进一步的研究。利用蛋白质的物理化学特性和氨基酸的位置统计特性,将蛋白质序列转换成数字序列,利用数学工具如小波变换对数字序列进行分解,然后进行特征提取,能将许多隐含在长而复杂的生物序列中的特征表现出来。提取的特征作为蛋白质伪氨基酸成分能很好描述蛋白质序列或片段的特征。同时设计了一种基于统计特性的耦合特征来对蛋白质片段进行描述,并将此特征应用到蛋白质翻译后修饰问题。本项目设计了多种集成学习框架,研究了蛋白质序列的自动分类技术,挖据蛋白质序列特征和蛋白质功能位点之间的关系。项目的研究结果对计算机辅助药物设计具有一定的指导意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

外泌体在胃癌转移中作用机制的研究进展

外泌体在胃癌转移中作用机制的研究进展

DOI:10.12354/j.issn.1000-8179.2021.20201763
发表时间:2021
3

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

DOI:10.7524 /j.issn.0254-6108.2017122903
发表时间:2018
4

猪链球菌生物被膜形成的耐药机制

猪链球菌生物被膜形成的耐药机制

DOI:10.13343/j.cnki.wsxb.20200479
发表时间:2021
5

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020

贾建华的其他基金

批准号:21301197
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:81701757
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:21771198
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:70041023
批准年份:2000
资助金额:5.00
项目类别:专项基金项目
批准号:70141028
批准年份:2001
资助金额:7.00
项目类别:专项基金项目
批准号:61761023
批准年份:2017
资助金额:37.00
项目类别:地区科学基金项目

相似国自然基金

1

蛋白质相互作用及结合位点的预测方法研究

批准号:61402326
批准年份:2014
负责人:郭菲
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目
2

基于深度学习方法预测蛋白质翻译后修饰位点

批准号:61762034
批准年份:2017
负责人:龙海侠
学科分类:F0213
资助金额:34.00
项目类别:地区科学基金项目
3

蛋白质功能位点预测方法的研究

批准号:20773006
批准年份:2007
负责人:李春华
学科分类:B0301
资助金额:26.00
项目类别:面上项目
4

蛋白质与蛋白质的结合位点结构比对方法研究

批准号:61202309
批准年份:2012
负责人:周柚
学科分类:F0213
资助金额:22.00
项目类别:青年科学基金项目