基于多标签学习的蛋白质翻译后修饰位点预测

基本信息
批准号:11671032
项目类别:面上项目
资助金额:48.00
负责人:徐岩
学科分类:
依托单位:北京科技大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:经玲,邓乃扬,李为东,丁军,张丽静,王丹龄,王伟,侯秋玲,李莉
关键词:
多标签学习生物信息最优化支持向量机
结项摘要

Posttranslational modification (PTM) in proteins is an important regulatory mechanism of protein functions. It has been a hot topic in proteomics due to its unsubstituted role in biological process and signaling pathway. The conventional experiments for identification of PTM sites are both laborious and low-throughput. The efficiency could be greatly improved through the machine learning algorithms. This project will systematically explore the posttranslational modification site prediction problems in proteins. We will develop multi-label learning models and solutions based on support vector machines which are different from the established binary models or PU problem. This project will make use of label correlation of PTMs as the extra information into the multi-label model because of the detailed background. This is different with the previous machine learning methods. In addition, the on-line web-server and off-line big data software will be developed in Java to make it convenient to experimenters. This project will make the study of PTMs more systematic and enrich the research and development in drug and the optimization methods.

蛋白质翻译后修饰是调控蛋白质功能的重要机制,在生物学过程和信号通路中发挥着不可替代的作用,因而是蛋白质组学研究中的一个热点问题。单纯使用实验鉴定修饰位点费时费力,而基于机器学习的计算途径可以大大提高实验的速度和效率。本项目将系统地研究蛋白质翻译后修饰位点预测的计算方法。与通常使用的机器学习方法将其提炼为两类分类问题或者PU问题不同,我们将其提炼为多标签学习问题。同时我们还将研究其基于支持向量机的模型、解法与特征学习。进一步,由于修饰位点本身特有的性质,本项目拟将修饰位点蕴含的生物特征作为额外信息标签相关性加入多标签学习模型中,从而建立改进的多标签模型,并给出求解方法。本项目还根据所提模型,研发在线预测网页和离线大规模数据预测软件包,方便实验者使用。本项目将使得对蛋白质翻译后修饰问题的研究更加深入和系统,促进有关药物的研发。同时对模型求解的探讨,也将丰富最优化的计算方法。

项目摘要

蛋白质在合成后需要经过不同的修饰后才能执行其功能,因此同一条蛋白经过不同的修饰所行使的功能也不相同。本项目对蛋白质翻译后修饰这一具体的实际问题进行了深入的研究并请将其提炼成数学中的多标签学习问题来进行研究,包括最新实验数据的获取、蛋白序列预处理及特征的构造。本项目根据实际问题的背景和已有的经验,针对不同的修饰类型构造了不同的特征,同时提出了结合特殊位置的氨基酸对次序信息提出新的特征构造方式,并取得了良好的性能。算法上主要基于机器学习中的多标签学习模型,同时根据具体问题进行了相应的改进,这样得到更符合于实际问题的多标签学习模型,进而得到性能更佳的预测器。为方便实验者使用和预测器的推广,本项目基于JAVA和Linux研发10余个免费在线预测网页,为实际使用提供了平台。本项目在基金的支持下顺利进行并超额完成任务,共发表SCI论文30篇,第一标注22篇,第二标注8篇。项目负责人徐岩教授团队以第一作者或者通讯作者共发表SCI文章15篇(第一标注12篇,第二标注3篇),其中高被引文章2篇,最高SCI引用达到103次,中科院分区一区 1 篇,二区文章6篇。项目主要参加者经玲教授团队发表SCI论文15篇,其中JCR分区1区论文一篇。共培养硕士研究生13名,博士研究生3名,其中北京市优秀毕业生和国家奖学金获得者杨影茜现在在香港科技大学攻读博士学位。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022

徐岩的其他基金

批准号:10601055
批准年份:2006
资助金额:16.00
项目类别:青年科学基金项目
批准号:30700881
批准年份:2007
资助金额:17.00
项目类别:青年科学基金项目
批准号:61461024
批准年份:2014
资助金额:43.00
项目类别:地区科学基金项目
批准号:11371342
批准年份:2013
资助金额:50.00
项目类别:面上项目
批准号:31271921
批准年份:2012
资助金额:86.00
项目类别:面上项目
批准号:11301024
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:30470046
批准年份:2004
资助金额:8.00
项目类别:面上项目
批准号:81470973
批准年份:2014
资助金额:66.00
项目类别:面上项目
批准号:20776060
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:71501113
批准年份:2015
资助金额:17.40
项目类别:青年科学基金项目
批准号:81770679
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:11203030
批准年份:2012
资助金额:20.00
项目类别:青年科学基金项目
批准号:60802050
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:81873734
批准年份:2018
资助金额:56.00
项目类别:面上项目
批准号:10971211
批准年份:2009
资助金额:25.00
项目类别:面上项目
批准号:81241033
批准年份:2012
资助金额:10.00
项目类别:专项基金项目
批准号:81201889
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:20376031
批准年份:2003
资助金额:22.00
项目类别:面上项目
批准号:81170688
批准年份:2011
资助金额:50.00
项目类别:面上项目
批准号:51605421
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于深度学习方法预测蛋白质翻译后修饰位点

批准号:61762034
批准年份:2017
负责人:龙海侠
学科分类:F0213
资助金额:34.00
项目类别:地区科学基金项目
2

基于机器学习的蛋白质翻译后修饰位点预测的研究

批准号:11301024
批准年份:2013
负责人:徐岩
学科分类:A0405
资助金额:22.00
项目类别:青年科学基金项目
3

蛋白质翻译后修饰位点物种特异性预测的特征抽取和学习算法研究

批准号:61403077
批准年份:2014
负责人:赵晓威
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
4

Tau蛋白翻译后修饰位点预测与修饰机制研究

批准号:21175064
批准年份:2011
负责人:邱建丁
学科分类:B0310
资助金额:68.00
项目类别:面上项目