基于低秩和图正则约束的矩阵分解方法研究及在癌症多组学数据中的应用

基本信息
批准号:61872220
项目类别:面上项目
资助金额:64.00
负责人:刘金星
学科分类:
依托单位:曲阜师范大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:郑春厚,尚军亮,高英莲,袁莎莎,孔祥真,魏丕静,徐秀秀,崔震,郝永静
关键词:
生物信息学流型学习癌症多组学数据低秩回归矩阵分解方法
结项摘要

It is a hot research topic how to mine some cancer-related information from heterogeneous cancer multi-omics data. Among the existing modeling methods, the method of matrix decomposition has been attracted tremendous attention. Aiming at the shortcomings of the existing methods, the methods of matrix decomposition will be studied for analyzing cancer multi-omics data. The main content includes: Firstly, to replace the nuclear norm by using the truncated nuclear norm, we will propose a low-rank representation method based on the constraint of the truncated nuclear norm; Secondly, by introducing category labels and sparse constraint into the principal component analysis (PCA) method, we will design a method of supervised sparse PCA; Thirdly, to explore the characteristics and the nonlinear structure of the samples simultaneously, we will design a dual-graph constraint PCA by introducing manifold learning into the two directions of the characteristics and samples; Fourthly, by introducing the sparse low-rank constraint into a multi-view regression, we will design a method of sparse multi-view low-rank regression; Finally, we will use these methods on multi-omics data to mine biological characteristics closely related to cancers. The implementation of this project can perfect the theoretical system of matrix decomposition, and can promote cancer multi-omics data analysis and research. Then, it can offer informatics support to the mechanism study for cancer at the molecular level, the early diagnosis and accurate treatment of cancer.

如何从异质性的癌症多组学数据中挖掘出与癌症密切相关的信息是当前的一个研究热点。在现有的建模方法中,矩阵分解方法是一类备受瞩目的方法。本项目针对现有方法的不足,拟研究面向癌症多组学数据分析的矩阵分解方法。具体内容如下:(1)用截断核范数替代核范数约束,设计出截断核范数约束的低秩表示方法;(2)在主成分分析方法上引入类别标签和稀疏约束,设计出有监督的稀疏主成分分析方法;(3)为了同时探索特征和样本的非线性结构,在主成分分析方法的特征和样本两个方向分别引入流型学习,设计出基于双图约束的主成分分析方法;(4)将稀疏低秩约束引入到多视图回归中,设计出稀疏多视图低秩回归方法;并且将这些方法用于癌症多组学数据的分析,挖掘出与癌症密切相关的生物特征。本项目的实施,既能完善矩阵分解的理论体系,又能促进癌症多组学数据的分析与挖掘,为在分子水平上研究癌症的机理、癌症的早期诊断和精准治疗提供信息学方法上的支撑。

项目摘要

在国家自然科学基金(No. 61872220)的资助下,课题组在癌症多组学数据分析的矩阵分解方法等方面做了一些工作,顺利地完成了预定任务。发表标注国家自然科学基金(61872220)的论文66篇,其中SCI论文49篇,中文核心论文1篇,国际会议论文16篇。IEEE TCYB发表论文2篇、IEEE TNNLS发表论文2篇、IEEE JBHI发表论文9篇、IEEE/ACM TCBB 5篇等。本项目针对癌症多组学数据的分析问题,围绕稀疏矩阵分解方法、图和超图流形约束、不同损失函数、多视图约束等方面展开研究,取得了一系列重要成果。(1)在图与超图正则约束的矩阵分解方面:提出了基于相关熵的超图正则化非负矩阵分解方法、基于加权图正则的协同矩阵分解方法、超图正则化约束非负矩阵分解方法、基于相似性和图正则约束的低秩表示方法、双超图正则化监督非负矩阵分解方法等;(2)在稀疏约束的矩阵分解方法方面:提出了基于监督判别信息和稀疏约束的主成分分析方法、双稀疏约束的张量主成分分析方法、双稀疏约束的协同矩阵分解方法等;(3)在多视图约束方面:提出了整合的超图正则主成分分析方法、基于多子空间单元相似性学习的非负矩阵分解方法、多标签融合协同矩阵分解、基于多视图随机游走图正则的低秩表示方法、低秩子空间集成聚类方法等;(4)在不同损失函数的矩阵分解方法方面:提出了基于图自动编码器的共识引导方法、最大相关熵准则的非负低秩表示方法、网络一致性投影和标签传递相结合的方法等;并且将这些方法用于癌症多组学数据的分析,挖掘出与癌症密切相关的生物特征。本项目所取得的研究成果,能够在一定程度上推动精准医疗的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020

相似国自然基金

1

基于非负矩阵分解的多组学数据分析方法及其在癌症基因信号识别中的应用

批准号:61402010
批准年份:2014
负责人:谢新平
学科分类:F0213
资助金额:24.00
项目类别:青年科学基金项目
2

应用于语音增强的低秩和稀疏矩阵分解模型及算法设计

批准号:61362031
批准年份:2013
负责人:孙成立
学科分类:F0111
资助金额:43.00
项目类别:地区科学基金项目
3

基于多组学数据的癌症驱动模块网络挖掘方法研究

批准号:61902216
批准年份:2019
负责人:李凤
学科分类:F0213
资助金额:27.00
项目类别:青年科学基金项目
4

基于多视图学习的癌症多组学数据聚类方法研究

批准号:61906198
批准年份:2019
负责人:刘健
学科分类:F0603
资助金额:22.00
项目类别:青年科学基金项目