Posttranslational modification (PTM) in proteins is an important regulatory mechanism of protein functions. It has been a hot topic in proteomics due to its unsubstituted role in biological process and signaling pathway. The conventional experiments for identification of PTM sites are both laborious and low-throughput. The efficiency could be greatly improved through the machine learning algorithms. This project will systematically explore the posttranslational modification site prediction problems in proteins. We will develop multi-label learning models and solutions based on support vector machines which are different from the established binary models or PU problem. This project will make use of label correlation of PTMs as the extra information into the multi-label model because of the detailed background. This is different with the previous machine learning methods. In addition, the on-line web-server and off-line big data software will be developed in Java to make it convenient to experimenters. This project will make the study of PTMs more systematic and enrich the research and development in drug and the optimization methods.
蛋白质翻译后修饰是调控蛋白质功能的重要机制,在生物学过程和信号通路中发挥着不可替代的作用,因而是蛋白质组学研究中的一个热点问题。单纯使用实验鉴定修饰位点费时费力,而基于机器学习的计算途径可以大大提高实验的速度和效率。本项目将系统地研究蛋白质翻译后修饰位点预测的计算方法。与通常使用的机器学习方法将其提炼为两类分类问题或者PU问题不同,我们将其提炼为多标签学习问题。同时我们还将研究其基于支持向量机的模型、解法与特征学习。进一步,由于修饰位点本身特有的性质,本项目拟将修饰位点蕴含的生物特征作为额外信息标签相关性加入多标签学习模型中,从而建立改进的多标签模型,并给出求解方法。本项目还根据所提模型,研发在线预测网页和离线大规模数据预测软件包,方便实验者使用。本项目将使得对蛋白质翻译后修饰问题的研究更加深入和系统,促进有关药物的研发。同时对模型求解的探讨,也将丰富最优化的计算方法。
蛋白质在合成后需要经过不同的修饰后才能执行其功能,因此同一条蛋白经过不同的修饰所行使的功能也不相同。本项目对蛋白质翻译后修饰这一具体的实际问题进行了深入的研究并请将其提炼成数学中的多标签学习问题来进行研究,包括最新实验数据的获取、蛋白序列预处理及特征的构造。本项目根据实际问题的背景和已有的经验,针对不同的修饰类型构造了不同的特征,同时提出了结合特殊位置的氨基酸对次序信息提出新的特征构造方式,并取得了良好的性能。算法上主要基于机器学习中的多标签学习模型,同时根据具体问题进行了相应的改进,这样得到更符合于实际问题的多标签学习模型,进而得到性能更佳的预测器。为方便实验者使用和预测器的推广,本项目基于JAVA和Linux研发10余个免费在线预测网页,为实际使用提供了平台。本项目在基金的支持下顺利进行并超额完成任务,共发表SCI论文30篇,第一标注22篇,第二标注8篇。项目负责人徐岩教授团队以第一作者或者通讯作者共发表SCI文章15篇(第一标注12篇,第二标注3篇),其中高被引文章2篇,最高SCI引用达到103次,中科院分区一区 1 篇,二区文章6篇。项目主要参加者经玲教授团队发表SCI论文15篇,其中JCR分区1区论文一篇。共培养硕士研究生13名,博士研究生3名,其中北京市优秀毕业生和国家奖学金获得者杨影茜现在在香港科技大学攻读博士学位。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
硫柳汞和苯扎氯铵联合用药的抗真菌协同作用和机制研究及对真菌性角膜炎模型治疗作用和对兔的毒性作用研究
基于深度学习方法预测蛋白质翻译后修饰位点
基于机器学习的蛋白质翻译后修饰位点预测的研究
蛋白质翻译后修饰位点物种特异性预测的特征抽取和学习算法研究
Tau蛋白翻译后修饰位点预测与修饰机制研究