基于机器学习的蛋白质翻译后修饰位点预测的研究

基本信息

批准号：11301024

项目类别：青年科学基金项目

资助金额：22.00

负责人：徐岩

学科分类：

依托单位：北京科技大学

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：丁军,刘秀芹,温馨,尚宏媛

关键词：

蛋白质翻译后修饰预测PU学习问题机器学习

结项摘要

Protein post-translational modifications(PTMs) play a very important role in living organisms which make the structure of proteins more complex, the function more perfect, the regulation more specific. Increasing evidences have indicated that abnormal PTMs exist in various major tumour and cancers.Therefore, accurate identifying the PTMs sites in proteins is very important to both cell mechanism and drug development. Experimental identification of PTMs sites with a site-directed mutagenesis strategy is laborious and low-throughput due to the labile nature and the low-abundance of PTMs. In the avalanche of protein sequences generated in the postgenomic age, it is highly desired to develop computational method for timely and reliably identifying the PTMs sites in proteins. In this project we would like to propose the new positive and unlabeled predictive model based on the new feature construct by incorporating the various protein data sources. We will develop the online webserver and offline large-scale data predictive software packages based Linux and Java. We mainly apply the optimization and machine learning approaches to construct the new predict model based on support vector machine and conditional random filed. Furthermore, we will study optimizational theory problems such as model selection. In conclusion this project would supply efficiently computational model and practical software for biologists. Meanwhile this project would promote not only drug discovery research but also the optimizational research.

蛋白质翻译后修饰是一种调节蛋白质功能的重要机制，使蛋白质的功能更为完善, 调节更为精细。最近研究发现蛋白质翻译后修饰与癌症、衰老、心脏病、老年痴呆等许多疾病密切相关，因此准确地识别蛋白质翻译后修饰位点不仅对于更深入地理解各种疾病发生的分子机制，而且对药物设计有重要的帮助。目前，通过实验鉴定这些修饰位点既耗费人力、物力又低产量,甚至对一些蛋白质修饰还很难测定。因此迫切需要开发计算方法来预测蛋白质翻译后修饰位点。本项目主要是研究整合蛋白质各种数据资源信息的新特征表示，进而建立更符合实际问题的部分有监督预测模型，开发在线预测网页及离线大规模数据预测软件包。研究主要采用最优化和机器学习的方法，提出基于支持向量机和条件随机场的新预测模型，并探索其中的模型选择等理论问题。本项目的研究不仅可以为生物学家提供有效的计算模型和实用软件，同时有利于药物研发领域的深入研究，而且还可以丰富最优化领域的研究内容。

项目摘要

本项目在基金的支持下顺利进行并完成任务。项目负责人已第一作者共发表SCI文章11篇，其中高被引文章4篇，最高SCI引用达到85次，累计引用400余次，中科院分区二区文章4篇。蛋白质在合成后需要经过不同的修饰后才能执行功能，因此同一条蛋白经过不同的修饰所行使的功能也不相同。本项目对蛋白质翻译后各种修饰这一具体的实际问题进行了深入的研究并将其提炼成数学中的PU问题来进行研究，包括最新实验数据的获取、蛋白序列预处理及特征的构造。特征构造是这一实际问题的关键所在，本项目根据实际问题的背景和已有的经验，针对不同的修饰类型构造了不同的特征，同时提出了结合特殊位置的氨基酸对次序信息提出新的特征构造方式，并取得了良好的性能。算法上主要基于机器学习中的模型，如支持向量机、K近邻、线性判别、决策树及条件随机场等算法，同时根据具体问题进行了相应的改进，这样得到更符合于实际问题需要的PU模型，进而得到性能更佳的预测器。为方便实验者使用和预测器的推广，本项目基于JAVA和Linux研发了近10个免费在线预测网页和离线软件包，为实际使用提供了平台。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

徐岩的其他基金

批准号：10601055

批准年份：2006

资助金额：16.00

项目类别：青年科学基金项目

批准号：30700881

批准年份：2007

资助金额：17.00

项目类别：青年科学基金项目

批准号：61461024

批准年份：2014

资助金额：43.00

项目类别：地区科学基金项目

批准号：11371342

批准年份：2013

资助金额：50.00

项目类别：面上项目

批准号：31271921

批准年份：2012

资助金额：86.00

项目类别：面上项目

批准号：30470046

批准年份：2004

资助金额：8.00

项目类别：面上项目

批准号：81470973

批准年份：2014

资助金额：66.00

项目类别：面上项目

批准号：20776060

批准年份：2007

资助金额：30.00

项目类别：面上项目

批准号：71501113

批准年份：2015

资助金额：17.40

项目类别：青年科学基金项目

批准号：81770679

批准年份：2017

资助金额：56.00

项目类别：面上项目

批准号：11203030

批准年份：2012

资助金额：20.00

项目类别：青年科学基金项目

批准号：60802050

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：81873734

批准年份：2018

资助金额：56.00

项目类别：面上项目

批准号：11671032

批准年份：2016

资助金额：48.00

项目类别：面上项目

批准号：10971211

批准年份：2009

资助金额：25.00

项目类别：面上项目

批准号：81241033

批准年份：2012

资助金额：10.00

项目类别：专项基金项目

批准号：81201889

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：20376031

批准年份：2003

资助金额：22.00

项目类别：面上项目

批准号：81170688

批准年份：2011

资助金额：50.00

项目类别：面上项目

批准号：51605421

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

相似国自然基金

基于多标签学习的蛋白质翻译后修饰位点预测

批准号：11671032

批准年份：2016

负责人：徐岩

学科分类：A0405

资助金额：48.00

项目类别：面上项目

基于深度学习方法预测蛋白质翻译后修饰位点

批准号：61762034

批准年份：2017

负责人：龙海侠

学科分类：F0213

资助金额：34.00

项目类别：地区科学基金项目

蛋白质翻译后修饰位点物种特异性预测的特征抽取和学习算法研究

批准号：61403077

批准年份：2014

负责人：赵晓威

学科分类：F0603

资助金额：25.00

项目类别：青年科学基金项目

Tau蛋白翻译后修饰位点预测与修饰机制研究

批准号：21175064

批准年份：2011

负责人：邱建丁

学科分类：B0310

资助金额：68.00

项目类别：面上项目

基于机器学习的蛋白质翻译后修饰位点预测的研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

新型树启发式搜索算法的机器人路径规划

现代优化理论与应用

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

徐岩的其他基金

非线性波动问题的数值模拟与分析

构建纳米载药控释系统通过持续多巴胺刺激防治帕金森病运动并发症的实验研究

基于甘南拉卜楞寺安全防范系统的语音信号增强技术研究

非经典双曲型守恒律方程数值模拟与分析

中国白酒中异味萜类化合物产生微生物的代谢机制及其对酿造微生物群落结构调控的研究

华根霉催化酯合成不同脂肪酶的基因克隆与表达

Cyr61对缺血性急性肾损伤后间质纤维化的影响及机制研究

理性构建双酶耦合型新催化剂及其催化立体异构反应过程研究

协同创新团队隐性知识共享有效性的随机动态博弈分析

肾损伤分子1启动子调控的miR-181d对缺血性急性肾损伤的保护作用及机制研究

利用lamost巡天数据研究银河系反银心方向子结构

宽色域理论与技术研究

左旋多巴诱导的异动症大鼠纹状体促甲状腺激素释放激素调节基底节运动环路脑网络连接的研究

基于多标签学习的蛋白质翻译后修饰位点预测

非线性波动方程高精度自适应算法的理论研究与数值模拟

硫柳汞和苯扎氯铵联合用药的抗真菌协同作用和机制研究及对真菌性角膜炎模型治疗作用和对兔的毒性作用研究

新候选抑癌基因INPP4B在胃癌中的功能及其分子机制研究

醇脱氢酶催化手性醇的去消旋化过程反应稳态动力学研究

cyr61过表达对缺血性急性肾损伤保护作用及其机制研究

累积反向挤压大变形诱导制备镁合金半固态坯料及组织性能调控

相似国自然基金