面向非激酶特异性蛋白质磷酸化位点的特征设计与预测模型研究

基本信息
批准号:11601407
项目类别:青年科学基金项目
资助金额:19.00
负责人:张胜利
学科分类:
依托单位:西安电子科技大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:刘倩,张哲,梁芸芸,王峰,李海燕
关键词:
特征提取信息融合磷酸化位点预测非激酶特异性机器学习
结项摘要

As one of the most crucial post-translational modifications in eukaryotes, reversible protein phosphorylation regulates almost all the processes of life activities. So prediction of phosphorylation sites has currently become a hot issue in bioinformatics and accurate non-kinase-specific prediction tools are highly desirable for whole genome annotation in a wider variety of species. This project aims at problems related to protein feature extraction, selection and fusion in non-kinase-specific prediction of phosphorylation sites, and focuses on how to extract key information in protein sequence and search for the effective prediction strategy. The main contents include: with comprehensive utilization of statistical analysis, we extract some features from various aspects including the physical and chemical properties of amino acids, overlapping properties, predicted protein secondary structure, predicted protein disorder, Shannon entropy, position specific scoring matrix and averaged cumulative hydrophobicity, and construct multiple information combination model. Then all the features extracted from different sequences based on maximum conditional relevance minimum redundancy criterion are combined into a feature set, and a few features are selected as the input of classifier. Finally the accuracy of prediction of protein phosphorylation sites can be improved by effective and efficient classification algorithm. The project-establishment is not only helpful to understand the important significance of post-translational modifications in the life process, but also can be widely used in drug development and disease treatment.

可逆的蛋白质磷酸化作为真核生物中重要的翻译后修饰活动之一,几乎调节着生命活动的所有过程。因此,磷酸化位点预测已经成为生物信息学研究中的一个热点问题。对于更广泛物种中的全基因组注释,发展精确的非激酶特异性预测工具的需求日益增加。本项目针对非激酶特异性磷酸化位点预测中特征的提取、挑选及融合等问题展开,重点研究如何充分提取蛋白质序列中的核心特征,寻找预测策略的有效建模方法。主要内容包括:综合利用统计分析理论从氨基酸物理化学性质、氨基酸交叉分类、蛋白质二级结构、无序信息、信息熵得分,PSSM得分和平均累积疏水性等方面提取特征,并建立蛋白质多重信息组合模型,基于最大条件相关最小冗余准则对多源信息进行有效地融合、挑选,通过设计合理的预测方案,提高蛋白质磷酸化位点预测的精确度。该项目立项,不仅有助于理解翻译后修饰在生命过程中的重要意义,还可在药物开发及其疾病治疗等方面得到广泛的实际应用。

项目摘要

可逆的蛋白质磷酸化作为真核生物中重要的翻译后修饰活动之一,几乎调节着生命活动的所有过程。因此,磷酸化位点预测已经成为生物信息学研究中的一个热点问题。对于更广泛物种中的全基因组注释,发展精确的非激酶特异性预测工具的需求日益增加。本项目针对非激酶特异性磷酸化位点预测中特征的提取、挑选及融合等问题展开,重点研究了如何充分提取蛋白质序列中的核心特征,寻找预测策略的有效建模方法。主要内容包括:综合利用统计分析理论从氨基酸物理化学性质、氨基酸交叉分类、蛋白质二级结构、无序信息、信息熵得分,PSSM得分和平均累积疏水性等方面提取特征,并建立蛋白质多重信息组合模型,基于最大条件相关最小冗余准则对多源信息进行有效地融合、挑选,通过设计合理的预测方案,提高蛋白质磷酸化等翻译后修饰位点预测的精确度。具体研究成果为:1.采用k近邻算法和BLOSUM80矩阵法对磷酸化位点进行预测,该方法具有简单、实用、时间复杂度低的优点。2.构建了多个特征设计方法识别蛋白质亚细胞定位,较大的提高了识别精确度。3.开发了两种去趋势移动平均自互相关系数的空间自动特征提取方法,证明了方法的有效性与鲁棒性。4.提出了预测器iRSpot-DTS,并对酵母III号染色体的全基因组进行了分析。5.建立了基于动态变异和随机转录的人类生命量化模型,对个人生物分子间相互作用和基因通路信息进行定量研究,找到了代谢综合症的关键基因通路。6.发展了多元统计模型DPC-DMACA-PSSM和ACCP-KL-NMF,该模型对革兰氏阴性菌分泌蛋白类型的鉴定是有效和可靠的。项目组圆满完成了研究计划,取得了一系列的具有独创性的结果。本项目的研究不仅有助于理解翻译后修饰在生命过程中的重要意义,还可在药物开发及其疾病治疗等方面得到广泛的实际应用。三年来,本项目共发表19篇高质量的论文,其中17篇发表在SCI检索期刊上,并有11篇发表在中科院JCR三区以上的SCI检索期刊上。其中一篇论文连续入选2018和2019年ESI高被引论文,引用次数为35次。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

张胜利的其他基金

批准号:19875038
批准年份:1998
资助金额:7.50
项目类别:面上项目
批准号:10374075
批准年份:2003
资助金额:21.00
项目类别:面上项目
批准号:11574400
批准年份:2015
资助金额:62.00
项目类别:面上项目
批准号:39200063
批准年份:1992
资助金额:4.80
项目类别:青年科学基金项目
批准号:21403109
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:11374237
批准年份:2013
资助金额:76.00
项目类别:面上项目
批准号:91964103
批准年份:2019
资助金额:80.00
项目类别:重大研究计划
批准号:11326201
批准年份:2013
资助金额:3.00
项目类别:数学天元基金项目
批准号:11074196
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:19105004
批准年份:1991
资助金额:1.50
项目类别:青年科学基金项目
批准号:11774280
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:31571667
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:61372078
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:11204379
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:U1204315
批准年份:2012
资助金额:30.00
项目类别:联合基金项目
批准号:60902016
批准年份:2009
资助金额:23.00
项目类别:青年科学基金项目
批准号:61771315
批准年份:2017
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

激酶特异性的蛋白质磷酸化预测方法研究

批准号:61101061
批准年份:2011
负责人:王明会
学科分类:F0124
资助金额:25.00
项目类别:青年科学基金项目
2

融合多种信息识别激酶特异的蛋白质磷酸化位点

批准号:60905014
批准年份:2009
负责人:李婷婷
学科分类:F0304
资助金额:18.00
项目类别:青年科学基金项目
3

蛋白质翻译后修饰位点物种特异性预测的特征抽取和学习算法研究

批准号:61403077
批准年份:2014
负责人:赵晓威
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
4

面向蛋白质亚细胞定位的特征提取与预测模型研究

批准号:11326201
批准年份:2013
负责人:张胜利
学科分类:A0604
资助金额:3.00
项目类别:数学天元基金项目