Respiratory syncytial virus (RSV) is one of the most important pathogenic infections of childhood and has significant morbidity and mortality. There are not yet desired therapeutic medicines and a convincing and safe vaccine available. In view of the advantages of metabolomics in disease diagnosis, the current project aims to combine UPLC/LTQ/Orbitrap-MS with some new developed multivariate chemometrics algorithms for recognizing the metabolic difference between the kids with respiratory syncytial virus-infected pneumonia and the healthy ones, identifying some biomarkers related to RSVP followed by constructing their metabolic network. UPLC/LTQ/Orbitrap-MS will be applied to detect the levels of small molecules in the plasma samples from two groups. The new multivariate algorithms for analyzing the obtained metabolomic profiles will be formed by combining the ensemble techniques and some traditional nonlinear modeling algorithms, i.e., classification tree (CT), Gaussian process (GP), radial basis function network (RBFN), least-squares support vector machine (LS-SVM). The execution of the current project may benefit for laying the foundation for mechanic research of RSVP and offering instructions for the prevention, early diagnosis, clinical rational treatment, and prognosis of RSVP. Moreover, the current project will establish the basic information theory and methodology for high-throughput analysis of data in metabolomics, and provide practical and effective tools for functional gene studies in post gene period.
小儿呼吸道合胞病毒肺炎(Respiratory Syncytial Virus Pneumonia, RSVP)严重威胁小儿身体健康,目前对该病既无理想的治疗方法和药物,又无安全有效的疫苗。基于代谢组学在疾病筛查中的优势,本项目拟采用液相色谱-质谱联用技术表征小儿RSVP疾病组和小儿健康组的血浆中小分子代谢物水平;引入并完善机器学习领域中的集成算法,以传统非线性建模算法(如分类树、高斯过程、最小二乘-支持向量机和径向基函数网络等)为基础,探索发展高性能的适合于代谢组学数据特性的生物化学计量学方法来进行数据解析,以获得组间代谢差异,筛选潜在的生物标志物;进而构建其代谢网络,从而为RSVP的发病机制研究提供理论基础,为RSVP的预防、早期诊断、临床合理治疗和预后等提供理论指导。同时,通过本项目的开展,拟建立高通量代谢组学数据解析的信息学理论和方法,为后基因时代功能基因研究提供有效而实用的工具。
项目开展两年来,本项目计划内容已全部完成,达到了预期的研究目标。.针对RSVP严重威胁少儿身体健康,而无理想的治疗方法和药物和安全有效的疫苗的问题,考虑到代谢组学在疾病诊断中的优势,本项目采用UPLC/LTQ/Orbitrap-MS结合新发展的多变量化学计量学算法来识别小儿RSVP疾病组和小儿健康组的血浆中小分子代谢物水平差异,并找寻表征这些差异的关键性的生物标志物。新发展的代谢组学数据解析方法以传统的传统的建模算法(如分类树,套索算法、径向基函数网络,支持向量极等)为基础,通过引入并完善集成算法来实现。包括引入bagging用于提高分类树径向基函数网络(CTRBFN)、套索算法(LASSO)的性能,形成了两种新型的代谢组学数据解析方法,即,BAG-CTRBFN和BAG-LASSO;结合集成算法bagging/boosting与分类树算法,发展了两种通用的稳健的变量选择策略,即BAGCT和BSTCT,并将其结合SVM,从而构建两类新型的代谢组学数据解析方法,即,BAGCT-SVM和BSTCT-SVM;此外,结合粒子群优化技术和bagging技术,提高bagging中各子模型之间的差异性,发展了选择性自助集成并用于提高CT算法的性能和变量选择的稳定性和可靠性(PSOBAGCT)。集成算法的引入,很大程度上提高了单个模型的识别能力和变量选择的可靠性和稳定性。.研究结果表明:各类样本间的代谢差异能被准确识别,同时,确定了RSV病毒影响小儿的甘油三酯、磷脂质类和磷脂酰乙醇胺的代谢。同时,葡萄糖-6-磷酸、L-丙氨酸、γ-谷氨酰亮氨酸、甲基琥珀酸、琥珀酸、2-羟基苯乙酸被显示在疾病组中的含量要明显高于健康组的含量。.因此,在本项目中,通过算法的构建及其应用研究,我们成功获得了多种适合于代谢组学数据特性的高性能的生物化学计量学方法,建立了高通量代谢组学数据分析的信息学理论和方法,为后基因时代功能基因研究提供有效而实用的工具,同时,发现了部分的RSVP的潜在的关键性的标志物,为RSVP的预防、早期诊断、临床合理治疗和预后等提供理论指导;此外,本项目中发展的多种新型的建模算法也丰富了化学计量学基础领域,提升了化学计量学的应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
结核性胸膜炎分子及生化免疫学诊断研究进展
基于代谢组学的小儿病毒性肺炎证候学生物标记物研究
呼吸道合胞病毒(RSV)发病免疫学机制的研究
代谢组学数据解析方法用于肺癌早期诊断
兰州地区呼吸道合胞病毒流行特征的研究