代谢组学研究是通过仪器对患者的血液、尿液等样品进行分析,获得含有生物学意义的代谢指纹图谱,用于疾病的早期诊断、治疗和预后等。由于获得的代谢组分(变量)成千上万,各组分之间的关系复杂,并且混有大量噪声,如何从这种高维数、小样本数据中筛选出对分类有作用的变量,目前尚缺乏有效的方法。本研究提出一种新的差异变量筛选方法- - 进化组合支持向量机(EC-SVM),该模型在支持向量机(SVM)模型的基础上通过遗传算法对组合支持向量机(C-SVM)加以优化和改进,通过信息融合和构造相应的统计量使差异变量提供的信息得到保留,实现变量筛选的目的。同时,期望利用本研究提出的方法对卵巢癌代谢组数据进行有效的分析,获得具有生物学意义的生物标志物,为其临床早期诊断提供科学依据和支持。
摘要:本研究使用液相色谱质谱联用仪检测技术对卵巢癌、卵巢良性囊肿患者以及健康对照志愿者的血浆、尿样进行检测,获得代谢指纹图谱数据,并通过XCMS软件包对图谱预处理,获得可用于分析的数据格式。针对数据具有变量维数高、样本量较小等特点,本研究基于对支持向量机、遗传算法、SAM、Boosting等多种方法研究的基础上提出一种新的算法——进化组合支持向量机(EC-SVM)。模拟实验证实在噪声变量适当的条件下,EC-SVM能够获得较好的判别能力,并能有效筛选出差异变量。RBF核函数具有较好的适应性。血浆代谢组学研究表明卵巢良恶性肿瘤间具有明显差异,经EC-SVM共筛选出19个血浆生物标志物;尿液卵巢癌代谢组学研究表明卵巢癌同卵巢囊肿对照间有较好的分类效果,并筛选和鉴定了12个对卵巢癌诊断具有潜在生物学意义的代谢标志物。代谢物化学鉴定通过网上HMDB和METLIN代谢物数据库和二级质谱等进行;标志物的代谢途径及其生物学功能并借助网上代谢通路数据库KEGG和SMPDB进行确定。本研究对为卵巢癌的早期诊断、合理治疗提供理论依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于支持向量机的Mobile Agent系统中数据分类方法研究
基于支持向量机的稻田虫害预测方法研究
面向大量数据的半监督支持向量机的优化方法研究
提高支持向量机处理复杂数据效能的方法研究