面向癌症基因组图谱数据分析的稀疏矩阵分解方法研究

基本信息
批准号:61572284
项目类别:面上项目
资助金额:66.00
负责人:刘金星
学科分类:
依托单位:曲阜师范大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:尚军亮,雷玉霞,李圣君,高晓冬,刘健,王冬,马春霞,李海涛
关键词:
特征抽取稀疏矩阵分解癌症基因组图谱稀疏约束
结项摘要

With the extremely large amounts of data generated by the project of The Cancer Genome Atlas (TCGA), it is an urgent issue how to integratedly analyze the data and mine some useful information from them. Among many methods for modeling the TCGA data, the methods based on matrix transformation have been receiving more attention. We will study the methods of sparse matrix decomposition for analyzing the TCGA data in view of the disadvantages of present methods. The following is detail: Firstly, we will consider how to design the method of robust principal component analysis based on block-sparse constraint on the TCGA data. The method will be able not only to integratedly analyze these data, but also to discriminately process the heterogeneous data. Secondly, we will consider how to develop the method of sparse matrix decomposition based on p-norm by relaxation method on the low-rank constraint. Thirdly, we will design the class-label-integration method of sparse principal component analysis by introducing class labels into matrix decomposition. Finally, these methods will be used to analyze the TCGA data. When this project is put into practice, it will not only improve the theoretical framework of matrix decomposition method, but also provide some new bioinformatics methods for illuminating the cancer mechanism of occurrence and development.

随着海量的癌症基因组图谱数据的产生,如何整合分析这些数据和挖掘出其中的有用信息是当前亟待解决的问题。在现有癌症基因组图谱数据的建模方法中,基于矩阵变换的方法是一类备受关注的方法。本项目针对该类方法的一些不足,研究面向癌症基因组图谱数据分析的稀疏矩阵分解方法。具体内容如下:(1)研究如何对癌症基因组图谱数据进行分块约束,设计出基于分块稀疏约束的鲁棒主成分分析的方法。这样就既能够保证联合处理不同性质的数据,又能够兼顾区别对待这些不同性质的数据。(2)研究如何对数据矩阵的低秩约束进行松弛处理,设计出基于p范数约束的稀疏矩阵分解方法。(3)探索在矩阵变换的过程中引入样本的类别信息,设计出整合类别信息的稀疏主成分分析方法。最终将这些方法用于癌症基因组图谱数据的分析。本项目的实施,既能够完善有关矩阵分解方法的理论体系,也能为进一步在分子水平上阐明癌症的发生、发展机制提供信息学方法上的支持。

项目摘要

在国家自然科学基金(No.61572284)的资助下,课题组在癌症基因组图谱数据分析的稀疏矩阵建模方法等方面做了一些工作,顺利地完成了预定任务。发表标注国家自然科学基金(61572284)的论文60篇,其中SCI论文43篇,IEEE Transactions on Neural Networks and Learning Systems发表论文1篇、IEEE/ACM Transactions on Computational Biology and Bioinformatics3篇、IEEE Transactions on NanoBioscience4篇、BMC Bioinformatics6篇、BMC Systems Biology1篇、Complexity3篇、Neurocomputing1篇等。 本项目针对癌症基因组图谱数据的挖掘问题,围绕稀疏矩阵分解方法、高维小样本数据的降维、特征基因的识别、肿瘤样本的分类和聚类等方面展开研究,取得了一系列重要成果。在稀疏矩阵分解方法方面,考虑到基因调控的稀疏性,通过施加不同的约束,提出了多种不同的稀疏约束的矩阵分解方法;结合癌症基因表达数据的生物特性,提出了多种不同的数据降维方法;融合基因表达数据的特征,基于提出的稀疏矩阵分解方法,提出了多种差异表达基因的识别方法;根据稀疏矩阵分解得到的子矩阵,对肿瘤样本数据进行分类和聚类研究。本项目在完成计划的研究内容后,还在与疾病相关的关联研究方面做了探索性的研究,并取得了初步的研究成果。本项目所取得的研究成果,能够在一定程度上推动精准医疗的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
2

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

感应不均匀介质的琼斯矩阵

感应不均匀介质的琼斯矩阵

DOI:10.11918/j.issn.0367-6234.201804052
发表时间:2019
5

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

DOI:
发表时间:2020

相似国自然基金

1

面向癌症基因表达数据分析的稀疏建模方法研究

批准号:61702299
批准年份:2017
负责人:孔祥真
学科分类:F0213
资助金额:27.00
项目类别:青年科学基金项目
2

面向低质量图像数据的稀疏低秩矩阵回归与分解方法研究

批准号:61603159
批准年份:2016
负责人:舒振球
学科分类:F0605
资助金额:19.00
项目类别:青年科学基金项目
3

基于非负矩阵分解的多组学数据分析方法及其在癌症基因信号识别中的应用

批准号:61402010
批准年份:2014
负责人:谢新平
学科分类:F0213
资助金额:24.00
项目类别:青年科学基金项目
4

基于L1范数约束稀疏矩阵分解的基因表达谱数据分析

批准号:61272339
批准年份:2012
负责人:郑春厚
学科分类:F0213
资助金额:80.00
项目类别:面上项目