面向非激酶特异性蛋白质磷酸化位点的特征设计与预测模型研究

基本信息

批准号：11601407

项目类别：青年科学基金项目

资助金额：19.00

负责人：张胜利

学科分类：

依托单位：西安电子科技大学

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：刘倩,张哲,梁芸芸,王峰,李海燕

关键词：

特征提取信息融合磷酸化位点预测非激酶特异性机器学习

结项摘要

As one of the most crucial post-translational modifications in eukaryotes, reversible protein phosphorylation regulates almost all the processes of life activities. So prediction of phosphorylation sites has currently become a hot issue in bioinformatics and accurate non-kinase-specific prediction tools are highly desirable for whole genome annotation in a wider variety of species. This project aims at problems related to protein feature extraction, selection and fusion in non-kinase-specific prediction of phosphorylation sites, and focuses on how to extract key information in protein sequence and search for the effective prediction strategy. The main contents include: with comprehensive utilization of statistical analysis, we extract some features from various aspects including the physical and chemical properties of amino acids, overlapping properties, predicted protein secondary structure, predicted protein disorder, Shannon entropy, position specific scoring matrix and averaged cumulative hydrophobicity, and construct multiple information combination model. Then all the features extracted from different sequences based on maximum conditional relevance minimum redundancy criterion are combined into a feature set, and a few features are selected as the input of classifier. Finally the accuracy of prediction of protein phosphorylation sites can be improved by effective and efficient classification algorithm. The project-establishment is not only helpful to understand the important significance of post-translational modifications in the life process, but also can be widely used in drug development and disease treatment.

项目摘要

可逆的蛋白质磷酸化作为真核生物中重要的翻译后修饰活动之一，几乎调节着生命活动的所有过程。因此，磷酸化位点预测已经成为生物信息学研究中的一个热点问题。对于更广泛物种中的全基因组注释，发展精确的非激酶特异性预测工具的需求日益增加。本项目针对非激酶特异性磷酸化位点预测中特征的提取、挑选及融合等问题展开，重点研究了如何充分提取蛋白质序列中的核心特征，寻找预测策略的有效建模方法。主要内容包括：综合利用统计分析理论从氨基酸物理化学性质、氨基酸交叉分类、蛋白质二级结构、无序信息、信息熵得分，PSSM得分和平均累积疏水性等方面提取特征，并建立蛋白质多重信息组合模型，基于最大条件相关最小冗余准则对多源信息进行有效地融合、挑选，通过设计合理的预测方案，提高蛋白质磷酸化等翻译后修饰位点预测的精确度。具体研究成果为：1.采用k近邻算法和BLOSUM80矩阵法对磷酸化位点进行预测，该方法具有简单、实用、时间复杂度低的优点。2.构建了多个特征设计方法识别蛋白质亚细胞定位，较大的提高了识别精确度。3.开发了两种去趋势移动平均自互相关系数的空间自动特征提取方法，证明了方法的有效性与鲁棒性。4.提出了预测器iRSpot-DTS，并对酵母III号染色体的全基因组进行了分析。5.建立了基于动态变异和随机转录的人类生命量化模型，对个人生物分子间相互作用和基因通路信息进行定量研究，找到了代谢综合症的关键基因通路。6.发展了多元统计模型DPC-DMACA-PSSM和ACCP-KL-NMF，该模型对革兰氏阴性菌分泌蛋白类型的鉴定是有效和可靠的。项目组圆满完成了研究计划，取得了一系列的具有独创性的结果。本项目的研究不仅有助于理解翻译后修饰在生命过程中的重要意义，还可在药物开发及其疾病治疗等方面得到广泛的实际应用。三年来，本项目共发表19篇高质量的论文，其中17篇发表在SCI检索期刊上，并有11篇发表在中科院JCR三区以上的SCI检索期刊上。其中一篇论文连续入选2018和2019年ESI高被引论文，引用次数为35次。.

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：

发表时间：2021

张胜利的其他基金

批准号：19875038

批准年份：1998

资助金额：7.50

项目类别：面上项目

批准号：10374075

批准年份：2003

资助金额：21.00

项目类别：面上项目

批准号：11574400

批准年份：2015

资助金额：62.00

项目类别：面上项目

批准号：39200063

批准年份：1992

资助金额：4.80

项目类别：青年科学基金项目

批准号：21403109

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：11374237

批准年份：2013

资助金额：76.00

项目类别：面上项目

批准号：91964103

批准年份：2019

资助金额：80.00

项目类别：重大研究计划

批准号：11326201

批准年份：2013

资助金额：3.00

项目类别：数学天元基金项目

批准号：11074196

批准年份：2010

资助金额：35.00

项目类别：面上项目

批准号：19105004

批准年份：1991

资助金额：1.50

项目类别：青年科学基金项目

批准号：11774280

批准年份：2017

资助金额：65.00

项目类别：面上项目

批准号：31571667

批准年份：2015

资助金额：63.00

项目类别：面上项目

批准号：61372078

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：11204379

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：U1204315

批准年份：2012

资助金额：30.00

项目类别：联合基金项目

批准号：60902016

批准年份：2009

资助金额：23.00

项目类别：青年科学基金项目

批准号：61771315

批准年份：2017

资助金额：62.00

项目类别：面上项目

相似国自然基金

激酶特异性的蛋白质磷酸化预测方法研究

批准号：61101061

批准年份：2011

负责人：王明会

学科分类：F0124

资助金额：25.00

项目类别：青年科学基金项目

融合多种信息识别激酶特异的蛋白质磷酸化位点

批准号：60905014

批准年份：2009

负责人：李婷婷

学科分类：F0304

资助金额：18.00

项目类别：青年科学基金项目

蛋白质翻译后修饰位点物种特异性预测的特征抽取和学习算法研究

批准号：61403077

批准年份：2014

负责人：赵晓威

学科分类：F0603

资助金额：25.00

项目类别：青年科学基金项目

面向蛋白质亚细胞定位的特征提取与预测模型研究

批准号：11326201

批准年份：2013

负责人：张胜利

学科分类：A0604

资助金额：3.00

项目类别：数学天元基金项目

面向非激酶特异性蛋白质磷酸化位点的特征设计与预测模型研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

新型树启发式搜索算法的机器人路径规划

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

张胜利的其他基金

纽结与物理学几个前沿问题

B-M动力学模型与碳纳米管构象及球蛋白质折叠

非高斯条件下的量子照明研究

比值性状的遗传特性及其长期选择效果的研究

过渡金属二硫属化物范德华异质结的组装、能带调控和光学性质研究

CETP输运胆固醇酯机理的分子动力学研究

面向高性能、低功耗晶体管的高态密度、长自由程新型二维电子材料的研究

面向蛋白质亚细胞定位的特征提取与预测模型研究

弯曲碳纳米管载流子的自旋轨道耦合及其物理效应

凝聚态物质的拓扑规范场理论

关键TOPK复合体结构及其调控癌症的分子物理机制研究

粗山羊草全基因组拷贝数变异（CNV）挖掘及相关CNV对普通小麦主要品质性状的影响

面向实用物理层网络编码的基础理论与算法研究

局域高斯操作辅助下的连续变量量子纠缠蒸馏研究

普通小麦及其3个近缘种中抽穗期基因TaHd1直向同源区进化分析

信道编码与物理层网络编码的联合编解码研究

异步非正交多用户接入的基础理论与算法研究

相似国自然基金