Recently, data independent acquisition (DIA) has provided new opportunities for deep coverage and high-throughput LC-MS based metabolomics. However, it is not satisfactory to get useful chemical and biological information from DIA data quickly and accurately. This project aims at some key problems in DIA data analysis, including acquisition of high quality MS1 and MS2 of the metabolites, reconstruction of the transition between precursor ion and fragment ions, development of software. After fully summarized the characteristics of DIA data, we hope to utilize the deconvolution method (MARS, EFA and MMSFA) and feature detection algorithms (KPIC, KPIC2 and FPIC) with good research basis, introduce blind source separation (BSS), network attached storage (NAS), base64 decoding and MySQL database technology in information science, combine with high performance computing tools (OpenMP, CUDA and GPGPU) and public databases (HMDB, METLIN and MassBank) resources, to study systematically the underlying algorithm for DIA data analysis. Finally, we hope to develop intelligent and high throughput software for DIA data analysis, to promote the metabolomics development.
近年,数据非依赖采集技术(DIA)为深度覆盖、高通量LC-MS/MS代谢组学研究提供了新的机遇,但快速、准确地从DIA数据中获取有用的化学、生物信息,却还不尽人意。本项目针对DIA数据分析中代谢物高质量MS1和MS2的获取、母离子与碎片离子联系(transition)的重构、分析软件的开发等关键问题,在充分归纳DIA数据特点的基础上,基于具有较好研究基础的去卷积方法(MARS、EFA和MMSFA等)和特征识别算法(KPIC、KPIC2和FPIC等),引入数学、信息科学中的盲源分离(BSS)、base64解码、网络附属存储(NAS)、MySQL数据库等技术,结合高性能计算工具(OpenMP、CUDA和GPGPU等)和公共数据库资源(HMDB、METLIN和MassBank等),系统地开展DIA数据分析底层基础算法研究,开发适合DIA数据智能、高通量分析的软件,推动代谢组学向前发展。
项目针对DIA液质数据分析中复杂大规模数据预处理、代谢物高质量MS1和MS2的获取、母离子与碎片离子联系的重构、代谢物准确鉴定等关键问题,在充分归纳DIA数据特点的基础上,引入深度学习技术,结合高性能计算工具和公共数据库资源,开发了系列适合代谢组学复杂大规模数据预处理、DIA数据MS1及MS2特征提取、母离子与碎片离子对应关系构建、代谢物准确定性定量的新算法及策略,包括MCR-DIA、DeepSWATH、DecPIC、DeepResolution、GNN-RT、FastEI等,与现有方法相比,这些方法都表现出了优异的性能,这些方法为代谢组学等复杂分析体系中化合物深度覆盖、高通量、准确鉴定提供基础技术支撑。所有方法工具都是实现开源,供代谢组学等相关研究者使用。已发表基金标注的学术论文21篇,参与出版专著3部,培养已毕业博士5人,硕士7人。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
硬件木马:关键问题研究进展及新动向
气相色谱-质谱法分析柚木光辐射前后的抽提物成分
基于数据非依赖型采集(DIA)质谱技术的代谢组学方法学和化学信息学的研究
OTF观测数据处理方法研究与软件开发
在线二维微液相色谱质谱新方法及在2型糖尿病代谢组学研究中的应用
基于液质联用技术和代谢组学方法的酸枣仁黄酮代谢动力学及睡眠调节机制研究