The protein panels show an increasing importance in the research of candidate biomarkers. The rapid development of “big data” and “multi-omics” research stimulates an urgent demand of a proteomics strategy with high throughput, deep data mining and high reproducibility. In contrast to the data-dependent acquisition (DDA) MS strategy, data-independent acquisition(DIA) methods provide measurement capacity of thousands of proteins per injection with high reproducibly, thus serve permanent quantitative digital proteome maps for cross-over study and post-acquisition analysis. However, the data analysis of DIA was now restricted to the reference library. To deepen the interpretation of DIA raw data, and to extend the analysis of targeted peptides in cross-over study, we aim to construct a predict spectral library using the information of predicted the MS2 fragment spectral (with deep learning strategy), predicted retention time and m/z value of peptides. We further apply the newly developed strategy to the analysis of serum samples of pancreatic cancer for both untargeted survey and targeted analysis of candidate protein biomarker panels.
近年来,蛋白质组合在疾病诊断标志物研究中的作用日益凸显,加之大数据和多组学交叉研究技术的进步,一种高效、深度、高重现的蛋白质诊断标志物筛选方法亟待被发展。常规基于数据依赖型(DDA)采集模式的蛋白质组研究策略在结果重现性方面存在不足。而基于数据非依赖型(DIA)采集模式的蛋白质组策略可以无差别地记录质谱可检测肽段的碎片信息,具有重现性好的特点,被认为是对肽段离子的数字化保存模式,但是其在数据深度挖掘方面仍然有限。我们拟通过深度学习技术对肽段MS2离子碎裂模式进行预测,结合准确的肽段保留时间预测和母离子m/z信息,建立预测参考谱图库,实现对DIA数据的深度挖掘和对感兴趣肽段/蛋白质的靶向分析,从而发展出新的基于DIA的蛋白质标志物筛选策略。我们预计将新发展的方法,结合已有的胰腺癌诊断标志物研究结果,应用到实际临床血清样品分析中,以期筛选到高灵敏度和高特异性的胰腺癌血清蛋白质诊断标志物组合。
近年来,飞速发展的质谱技术、大数据技术被广泛应用于蛋白质诊断标志物组合的研究中。质谱数据非依赖型采集模式(DIA)具有高重现性,数据可回溯分析等优势,具有广泛的临床蛋白质组研究应用前景。然而DIA数据的分析仍然存在数据分析效率低,灵活性和针对性不足。本项目我们对质谱数据进行深度学习和建模,预测肽段的MS2谱图和保留时间等信息,建立了DeepDIA的分析模式。结果显示使用DeepDIA 技术,比使用通用模型产生的谱图库(Prosit), 能够鉴定到更多的肽段和蛋白质,重复性更好,效果接近DDA 构建的谱图库,提高了分析效率。在项目执行过程中,我们发现基于特定仪器数据构建模型可以较准确预测针对肽段可检性。由此,我们进一步开发了DeepPRM 技术,实现了对来源于文献、组织分泌蛋白和血清差异蛋白组成的大规模潜在蛋白质标志物的靶向检测方法高效开发和血清学验证,获得了一组高灵敏高特异性血清标志物组合,证明本项目开发的谱图预测技术临床蛋白质组学中的广泛应用。在DeepDIA 技术应用到胰腺癌血清样品分析过程中,我们开发了快速样品前处理技术,将传统的样品缩短至1.5小时甚至30分钟,并在96孔板中验证了其高重现性,具有与自动化工作平台结合并实现转化的可能性。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于iTRAQ技术高通量筛选梅毒血清固定血清学诊断标志物
基于质谱多反应监测技术的高通量,高灵敏的血清生物标志物定量确证技术的发展与应用
数据挖掘技术在血液肿瘤基因诊断中的应用研究
基于FRET技术血清RNase A的检测及其在肿瘤诊断应用中的研究