Protein post-translational modifications (PTMs) are widespread in eukaryotic cells, and play a crucial role in their life activities. Identification of protein post-translational modification has become one of the major challenges in proteomics research. Tandem mass spectrometry combined with database searching strategy allows high-throughput identification of peptides and proteins. However, identification of modification by the traditional search engines is far from enough to meet the actual needs. It's necessary for us to develop specific algorithms and strategies for PTM identification, which can identify the modifications by sequence or spectrum alignment without restricting the type and mass of PTMs. And that is what we called unrestricted post-translational modification identification. In this project, we plan to conduct a comprehensive investigation on unrestricted post-translational modification identification to improve the PTM identification in shotgun proteomics. We will take full advantage of the high accuracy mass spectrometry data to development the method to construct peptide sequence tags, and then achieve the multi- PTMs identification on a single peptide in large scale database by sequence alignment. One of the most innovative aspects of the project is to construct a three-dimensional quality control system by establishing an objective evaluation for modification peptide, modification type and modification location simultaneously. On the basis of these concepts, the sensitivity and specificity of PTM identification can be greatly improved, and it would benefit the interpretation of protein biological function.
蛋白质翻译后修饰在真核生物细胞内广泛存在,对其生命活动起到至关重要的作用,蛋白质翻译后修饰鉴定已成为蛋白质组研究的重大挑战之一。目前,传统搜索引擎鉴定修饰已远不能满足实际的需要,我们有必要采用合理的算法和策略专门针对翻译后修饰进行鉴定,在质谱数据分析过程中不限制修饰的类型和数量,直接通过序列比对或谱图匹配的方法实现一定质量范围内翻译后修饰的完备鉴定,即非限制翻译后修饰鉴定。本项目将充分利用高精度质谱数据的特点,发展构建肽序列标签的方法,发挥基于序列比对修饰鉴定的优势,实现应用于大规模数据库的单肽段多位点修饰鉴定。同时针对修饰进行质量控制研究,围绕修饰肽段、修饰类型、修饰位点构建三维质控体系,在保证结果灵敏度的基础上,实现翻译后修饰的高可信鉴定,以提高质谱数据的解析率并为解释蛋白质生物学功能提供更丰富的信息。
蛋白质翻译后修饰在真核生物细胞内广泛存在,对其生命活动起到至关重要的作用,蛋白质翻译后修饰鉴定已成为蛋白质组研究的重大挑战之一。目前,传统搜索引擎鉴定修饰已远不能满足实际的需要,本课题充分利用高精度质谱数据的特点,并结合数学、统计学、质谱信息学等多学科的优势对蛋白质组质谱数据翻译后修饰鉴定的分析流程、质量控制和整合方法进行了深入研究。.针对已有磷酸化修饰质量控制算法存在的问题以及大规模修饰组学数据分析的需要,开发了一套完整的修饰数据集搜库结果质控流程,保证修饰肽段与位点鉴定的准确性与灵敏度。流程主要包括修饰肽段质控、修饰位点概率打分、修饰位点Motif特征重打分以及蛋白质水平统计展示模块。修饰肽段质控算法在常规肽段质控使用特征集合基础上,加入磷酸化修饰中性丢失特征,针对不同碎裂模式质谱数据进行特征筛选,保证肽段鉴定灵敏度。位点概率打分算法利用基于二项分布的数学模型,将匹配子离子数转化成概率,评估位点鉴定的准确性。针对那些概率打分算法不能精确定位的高可信修饰肽段匹配结果,在修饰位点概率打分基础上,引入Motif序列特征,提升修饰位点判定的灵敏度。.基于项目研究成果,研发了系列质谱数据分析软件,包括ProDistiller、PhosphoDistiller、FTDR 2.0和SILVER,已被30多个国家或地区下载500余次,获得了广泛的应用;基于项目成果应用构建了系列知识数据库,包括ProteomeView、iProX、LiverAtlas和LiverWiki,共获得国内外超过272,000次访问;项目发展的软件平台已成功应用于人类染色体蛋白质组计划、中国人类蛋白质组计划以及人类肝脏蛋白质组数据集整合分析中,至今已完成超过10亿万张谱图的解析。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
低轨卫星通信信道分配策略
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于质谱数据的非限制性翻译后修饰检测算法研究
基于串联质谱数据的非限制修饰蛋白质数据库搜索鉴定算法研究
串联质谱数据多种搜索引擎鉴定肽段整合方法的研究
基于串联质谱数据的多肽鉴定半监督学习并行算法研究