基于随机游走图和样本几何与标记信息的混合模型构造直推SVM的癌症转移复发分类

基本信息
批准号:61572166
项目类别:面上项目
资助金额:64.00
负责人:史明光
学科分类:
依托单位:合肥工业大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:潘平,吴敏,赵锐,李雪,李富健,王哲,郑哲
关键词:
样本几何信息与标记信息的融合低密度分割算法随机游走的密度敏感图癌症转移复发基于高斯混合模型核函数的直推式支持向量机
结项摘要

Cancer metastasis and recurrence is the leading cause of high mortality. Predicting the risk of metastasis and recurrence is the typical learning with extremely sparse labeled data. The small sample size problem is characterized by the limited amount of labeled data and the large amount of unlabeled data. We present the novel semi-supervised learning method, low density separation algorithm. It is assumed that the learning performance improve by exploiting the large amount of unlabeled data. Firstly, the graph is constructed with random walk and density sensitive algorithm. Secondly, the regularization framework of mixture model integrating the geometric information and tag information by the definition of middle variable is represented for multidimensional scaling analysis. Thirdly, Transductive Support Vector Machine(TSVM) is proposed with the Gauss mixture model kernel. The localized generalization error model is presented to estimate the generalization error of low density separation algorithm. Meanwhile, the performance metric, area under the curve (AUC), is presented for robustness evaluation. The semi-supervised learning framework is developed with cancer genomics data and low density separation algorithm from gene expression data and microRNA data. The semi-supervised classifier is built to predict the cancer metastasis and recurrence, and estimate the prognosis of multiple cancers. The semi-supervised learning framework underpins the personal medicine and prognosis of cancer.

癌症的转移复发是导致癌症患者高死亡率的最重要原因。癌症转移复发预测问题是典型的稀疏标记样本学习问题,少量的有标记样本和大量的未标记样本是小样本问题的重要特征。基于大量的未标记样本能够改进学习性能这一假设,提出一种新颖的半监督学习方法,低密度分割算法。首先,提出基于随机游走的密度敏感图构造方法;其次,在多维度分析方法研究中,提出样本几何信息与标记信息的混合模型正则化框架,设计几何信息与标记信息的平衡系数;最后,构造基于高斯混合模型核函数的直推式支持向量机。分别设计局部泛化误差模型与性能测度AUC值,对低密度分割算法的泛化能力与鲁棒性作出评价。基于基因表达谱数据与microRNA数据,构建基于癌症基因组学数据与低密度分割算法的半监督学习算法框架,得到预测癌症转移复发的半监督分类器,用于多种癌症的预后判断。该半监督学习算法框架为癌症的预后判断与个体化治疗提供依据,具有重要的科学意义与应用价值。

项目摘要

癌症的转移复发是恶性肿瘤最显著的生物学表型,也是影响其预后的首要因素。围绕癌症转移复发的分子机制研究这一中心问题,从构建基于树型结构学习算法的癌症转移复发预测模型,基于癌症分子网络的转移复发预测模型建立,构建化疗敏感性预测模型,癌症分子标志物挖掘与癌症分型研究等五个方面展开研究。首先,提出了一种基于树型结构的癌症多组学数据降维算法,构建了基于支持向量机方法的癌症转移复发预测模型,对于癌症的个体化治疗具有重要意义。其次,针对急性髓细胞白血病的高度异质性,挖掘得到决定其转移复发的miRNA-mRNA功能调控模块GMI。基于网络分子标志物GMI的随机生存森林模型能够有效预测白血病患者的生存预后,为预后判断提供科学依据。再次,基于随机行走模型挖掘与癌症转移复发密切相关的分子子网,基于分子子网构建癌症化疗敏感性预测模型。该模型能够有效地评价癌症患者的化疗敏感性水平。再次,构建结直肠癌多分子预测模型ColoFinder,为结直肠癌患者转移复发的早期诊断提供重要科学依据。最后,提出一种基于Nyström近似化的谱聚类模型CSISCN,用于识别癌症分子亚型,为解析癌症的高度异质性,实现个体化治疗提供重要的科学依据。综上所述,基于癌症转移复发的分子机制研究,为癌症的预后判断和个体化治疗提供科学依据,具有重要的科学意义与应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

相似国自然基金

1

基于图上随机游走的分类算法研究

批准号:61003180
批准年份:2010
负责人:徐晓华
学科分类:F06
资助金额:19.00
项目类别:青年科学基金项目
2

二维随机几何图上的随机游走

批准号:11901145
批准年份:2019
负责人:李安水
学科分类:A0210
资助金额:25.00
项目类别:青年科学基金项目
3

基于信息几何和测度学习的混合高斯模型距离研究及在图像分类中的应用

批准号:61471082
批准年份:2014
负责人:李培华
学科分类:F0116
资助金额:78.00
项目类别:面上项目
4

图像分类中的局部泛化误差SVM特征和样本选择方法

批准号:61003171
批准年份:2010
负责人:吴永贤
学科分类:F0605
资助金额:21.00
项目类别:青年科学基金项目