面向癌症基因表达数据分析的稀疏建模方法研究

基本信息
批准号:61702299
项目类别:青年科学基金项目
资助金额:27.00
负责人:孔祥真
学科分类:
依托单位:曲阜师范大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:袁莎莎,马旭,李圣君,代凌云,王雅萱,冯春梅,侯米潇,武莎莎
关键词:
稀疏建模方法癌症基因表达数据特征选择聚类
结项摘要

It has become one of research hotspots in the post-genome era to analyze and diagnose the disease using the gene expression data of cancer. Therefore, it is an urgent problem to explore the new methods of data analysis to adapt to the characteristics of the gene expression data of cancer. Based on the sparse modeling theory, this paper intends to study the sparse modeling method for cancer gene expression data. The research contents are as follows: (1) based on the characteristics of cancer gene expression data, design a new sparse L1- regularization method based on singular value decomposition; (2) design a novel sparse matrix decomposition based on p norm constraint and the corresponding efficient solving method; (3) in order to improve the performance of sparse matrix low rank constraint, based on truncated nuclear norm constraint, design a innovative sparse matrix decomposition method ; and apply the method above to analysis the gene expression data of cancer. The implementation of this project can not only improve the application of the theoretical system of sparse modeling in the field of biological information, promote the research works of the analysis method of gene expression data analysis of cancer, but also for the study of relationship between cancer and gene at the molecular level in the future and for improving the efficiency of cancer diagnosis, provide strong information technology support for personalized treatment of cancer.

利用癌症基因表达数据来分析诊断病症,已成为后基因组时代的研究热点之一。因此,探索适应癌症基因表达数据特点的数据分析新方法,从中挖掘有效的信息,成为生物信息学领域亟待解决的问题。本项目基于稀疏建模理论,拟研究面向癌症基因表达数据的稀疏建模方法。研究内容如下:(1)结合癌症基因表达数据的特点,设计出新的基于L1正则化约束的稀疏奇异值分解方法;(2)设计出新的基于p范数约束的矩阵分解方法和高效的求解方法;(3)为了改进低秩约束的稀疏矩阵分解方法的性能,基于截断核范数约束,设计出新的稀疏矩阵分解方法;并将上述方法用于癌症基因表达数据的分析。本项目的实施,既能够完善稀疏建模理论体系在生物信息领域的应用,推进癌症基因表达数据分析方法的研究,也为下一步在分子水平上研究癌症与基因的关系,提高癌症诊断的效率,为个性化地治疗癌症提供信息学方法上的有力支持。

项目摘要

利用癌症基因表达数据分析诊断病症,以及预测与疾病之间的关联已成为后基因组时代的研究热点。本课题在研究过程中,探索了适应癌症基因表达数据特点的稀疏建模方法和新的疾病关联预测方法。主要研究成果包括三个方面:(1)对已有的稀疏建模方法的进行改进并将其用在癌症基因表达数据分析中。提出了一种基于稀疏约束和标签信息判别的主成分分析模型(SDSPCA);提出了一种新的混合范数拉普拉斯正则化方法(MLLRR-PMD);提出了对称稀疏约束下的图正则化低秩表示方法(sgLRR);提出了一种用于癌症样本聚类和特征选择的超图鲁棒非负矩阵分解方法(HRNMF)等。以上方法应用于癌症样本聚类分析以及差异表达基因的提取,取得了显著的效果。(2)共表达基因网络模块识别方法的提出及应用。提出了一种基于多癌症融合数据的共表达网络信息挖掘方法(PMN);提出了一种集成图正则化非负矩阵分解方法(iGMFNA);提出了一种基于Lp范数和L2,1范数约束的图拉普拉斯主成分分析方法(PL21GPCA)。以上方法有助于识别基因共表达模块以及寻找可能与某些癌症相关的关键基因。(3)疾病关联预测方法的提出及应用。提出了一种加权图正则化协同矩阵分解方法(WGRCMF)来预测lncRNA疾病关联;提出了一种基于网络一致性投影和标签传递的微生物-疾病关联预测方法(NCPLP);提出了一种基于矩阵补全的协同矩阵分解方法(MCCMF),来预测miRNA与疾病的关联。大量实验表明了以上方法的可行性和有效性。通过本项目的实施,从一定程度上完善了稀疏建模理论体系在生物信息领域的应用,推进了癌症基因表达数据分析以及疾病关联预测方法的研究,也为在分子水平上研究疾病与基因的关系,提高癌症诊断的效率,为个性化地治疗癌症提供信息学方法上的有力支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
4

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
5

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020

孔祥真的其他基金

相似国自然基金

1

面向癌症基因组图谱数据分析的稀疏矩阵分解方法研究

批准号:61572284
批准年份:2015
负责人:刘金星
学科分类:F0213
资助金额:66.00
项目类别:面上项目
2

面向多种癌症多尺度组学数据融合的结构稀疏化方法研究

批准号:61802157
批准年份:2018
负责人:闵文文
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
3

用于癌症基因诊疗的基因表达图谱智能盲数据分析

批准号:60371044
批准年份:2003
负责人:张军英
学科分类:F0124
资助金额:7.00
项目类别:面上项目
4

面向癌症预后预测的基因影像学分析方法研究

批准号:61902183
批准年份:2019
负责人:邵伟
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目