基于小波变换的代谢组低浓度标志物统计分析模型与方法研究

基本信息
批准号:81302511
项目类别:青年科学基金项目
资助金额:24.00
负责人:李贞子
学科分类:
依托单位:哈尔滨医科大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:武晓岩,李昂,孙凤宇,宋欠欠,李俊南
关键词:
特征提取代谢组学生物标志物统计模型不完全树型小波变换
结项摘要

According to the metabolomic fingerprint data, we can study the metabolomic characteristics of tumor's proliferation, invasion and metastasis process. As we know, the number of metabolites is huge and their contents usually differ from each other by as much as 7 to 9 order of magnitude, which makes it almost impossible to discover the import low abundance tumor biomarkers. Currently, the main method is to do the feature selection based on the metabolomic data. However, the number of metabolites is usually over 100 thousands, it is extremely difficult to distinguish the important biomarkers in low concentration. The idea proposed in this project, is to estimate the position and retention time of the important biomarkers based on the analysis of the auto-correlation of the metabolites in low concentration. The method we used in this project is the incomplete tree-structured wavelet transform based on Sobel operator, which transforms the one-dimensional chromatography data into two-dimensional image using different scales. Then, AdaBoost algorithm is applied to do the pattern recognition and feature selection, with the purpose of screening the potential important biomarkers in low concentration. The content of this project includes the choice of the functions and parameters used in wavelet transform, algorithm used in image feature selection, validation of feature-similarity degree, the AdaBoost models and algorithm. This study would provide more effective statistical models and data analysis methods for identifying the important metabolomic biomarkers in low concentration.

通过代谢组指纹图谱数据,可以研究机体内在肿瘤发生增殖、侵袭或转移过程中的代谢模式特征。由于代谢组分数量巨大且浓度含量极微变动范围宽达7~9数量级,使重要的低丰度肿瘤标志物难以显现。目前,主要通过分析代谢组质谱数据筛选标志物,由于其数量巨大,各种物质及碎片可达10万以上,识别低浓度标志物极为困难。本项目的思想是,根据色谱中低浓度代谢物数据的自相关信息,对区分恶性肿瘤具有重要作用的标志物及保留时间位置进行估计,在此基础上对其质谱数据进行分析。使用的方法:基于Sobel算子的不完全树型小波变换,将代谢组一维色谱数据通过不同尺度换成二维图像,再使用AdaBoost算法对其图像进行模式识别和特征提取,筛选潜在的低浓度生物标志物。研究的具体内容:小波函数及参数的选择、提取图像特征算法、特征相似度验证、AdaBoost模型与算法。本研究将为识别代谢组低浓度肿瘤标志物提供更为有效的统计模型及数据分析方法。

项目摘要

本研究使用高效液相色谱质谱联用仪检测技术对卵巢癌、卵巢良性囊肿患者的血样、尿样进行检测,获得代谢组学色谱指纹图谱数据。针对数据具有代谢组分数量巨大且浓度含量极微变动范围宽达7~9数量级,使重要的低丰度肿瘤标志物难以显现的特点,利用色谱数据具有时间序列自相关信息,将一维代谢组色谱图通过小波变换转换为具有位置特征的二维图像,再使用模式识别算法对图像进行特征提取,筛选出潜在且具有重要意义的低丰度生物标志物。本研究得到的主要研究结果具体如下:(1)将连续小波多尺度变换、矩阵分割特征提取分析应用于色谱数据中分析,结果显示较原始数据判别分类能力有显著的提高且分类效果稳定,筛选出8个对卵巢癌诊断具有潜在生物学意义的标志物。并通过METLIN和HMDB数据库及查阅相关文献证明有些物质已被认定与卵巢癌、淋巴癌、结肠癌等疾病有关。其中2-哌啶酮做了二级质谱的标准品比对,被认定为卵巢癌生物标志物,并通过实验证明2-哌啶酮具有强烈的抗肿瘤效果,对卵巢癌细胞的增殖抑制体现为多靶点作用。(2)针对二维小波系数图像,应用Gabor小波图像特征提取分析、图像锐化小波系数图像特征提取分析,结果显示分类效果都有显著提高,而且通过设置不同的参数,可以获得小波系数图像不同的内在特征。Gabor小波图像特征提取分析筛选出8个血浆潜在生物标志物,然后通过代谢物数据库和二级质谱等进行代谢物化学鉴定。(3)在小波变换的基础上,研究了最大重叠离散小波变换,并将其应用于代谢组学数据的分析中,该方法能够较好地去除一定的噪声和批次效应,提高分析方法的有效性和稳定性。综上所述,本研究将为识别代谢组低丰度肿瘤标志物、卵巢癌的早期诊断、合理治疗提供重要的理论依据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
5

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019

李贞子的其他基金

相似国自然基金

1

基于小波变换的海洋声学参数获取方法研究

批准号:10674149
批准年份:2006
负责人:林京
学科分类:A2302
资助金额:34.00
项目类别:面上项目
2

基于小波变换构建结构动力无损诊断关键理论与方法

批准号:50608027
批准年份:2006
负责人:曹茂森
学科分类:E0806
资助金额:26.00
项目类别:青年科学基金项目
3

基于小波变换和空时模型的动态纹理分析

批准号:60902064
批准年份:2009
负责人:乔玉龙
学科分类:F0116
资助金额:22.00
项目类别:青年科学基金项目
4

基于小波变换的控制系统分析与设计方法

批准号:69504007
批准年份:1995
负责人:张霖
学科分类:F0301
资助金额:10.00
项目类别:青年科学基金项目