激酶特异性的蛋白质磷酸化预测方法研究

基本信息
批准号:61101061
项目类别:青年科学基金项目
资助金额:25.00
负责人:王明会
学科分类:
依托单位:中国科学技术大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:冯焕清,张相华,刘伟,潘为,邹亮
关键词:
核酸与蛋白等生物分子的信息挖掘生物信息学激酶特异性磷酸化机器学习
结项摘要

蛋白质磷酸化过程是真核细胞生命活动最普遍的调控手段,具有重要的研究意义。发展基于机器学习理论的蛋白质磷酸化预测方法,可以弥补现有实验检测技术中的缺陷,有助于蛋白磷酸化的研究。本课题从以下三个方面改进现有蛋白质磷酸化的预测方法:1)发展专用的机器学习分类方法,扩充现有磷酸化蛋白质数据中所缺乏的蛋白激酶信息,大幅度增加蛋白质磷酸化预测工作的可用数据量;2)收集目前所有已知有助于蛋白质磷酸化预测的生物信息特征加以系统全面地研究;3)引入wrapper、随机森林等新的特征选择技术,将特征选择和蛋白质磷酸化预测紧密结合起来。通过从数据、特征、算法三个角度同时改进现有方法,可以显著提高蛋白质磷酸化预测的性能,并有助于阐明蛋白质磷酸化的生物学机理。在此基础上,构建扩展磷酸化蛋白质和蛋白激酶信息的网络公共数据库和激酶特异性蛋白质磷酸化的在线预测系统,为相关的生物、医学、制药等研究提供理论指导和帮助。

项目摘要

蛋白质磷酸化过程具有重要意义,目前国内外的相关研究日益增多。本项目从数据、特征、算法三个角度对基于机器学习理论的蛋白质磷酸化预测问题进行了深入研究。首先,系统地搜集、整理了大量蛋白质磷酸化位点和其相关的蛋白激酶信息,建立了算法训练和性能评估的高质量数据集并发展了有效利用多源异质生物信息特征的蛋白激酶指派算法,其性能显著优于目前现有的预测方法。此外,构建了包括磷酸化位点附近的局部序列、蛋白-蛋白相互作用、基因本体信息、二级结构、可溶性和无序性在内等多种生物学特征,用于蛋白质磷酸化的预测研究。在上述研究的基础上,针对磷酸化相关特征维数过高的问题,提出了基于最小冗余最大相关准则的wrapper特征选择方法,通过与SVM、random forest等分类器结合,对蛋白激酶及特异性的磷酸化位点进行准确预测,并对特征选择和预测的结果从生物学角度进行了分析和理解,有助于阐明蛋白质磷酸化的分子机理。针对目前普遍认可的蛋白激酶层级结构(组-家族-亚家族-激酶),从不同层面上研究了磷酸化预测以及相关特征选择的问题,取得了一些具有普遍意义的发现,显著提高了现有预测方法在不同激酶层级上的最好性能。此外,利用在上述研究中发展的预测算法,首次系统地开展了磷酸化修饰与人类重大疾病相关性的预测工作。作为重要的生物信息学资源,开发了用于蛋白激酶指派的网络计算平台PKIS,同时公开了研究中所提出的特征选择和预测算法的源代码以及相应的磷酸化位点和蛋白激酶的数据,为磷酸化相关的生物、医学、制药等研究提供理论指导和计算工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
5

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

DOI:10.5846/stxb201912262800
发表时间:2020

相似国自然基金

1

面向非激酶特异性蛋白质磷酸化位点的特征设计与预测模型研究

批准号:11601407
批准年份:2016
负责人:张胜利
学科分类:A0604
资助金额:19.00
项目类别:青年科学基金项目
2

蛋白质酪氨酸激酶、蛋白质激酶C介导的磷酸化过程对肾脏钾通道的调节机制

批准号:30370734
批准年份:2003
负责人:林道红
学科分类:C0702
资助金额:20.00
项目类别:面上项目
3

融合多种信息识别激酶特异的蛋白质磷酸化位点

批准号:60905014
批准年份:2009
负责人:李婷婷
学科分类:F0304
资助金额:18.00
项目类别:青年科学基金项目
4

磷酸化相关的蛋白质翻译后修饰Crosstalk及激酶的计算识别方法和分析研究

批准号:61471331
批准年份:2014
负责人:王明会
学科分类:F0124
资助金额:80.00
项目类别:面上项目