Variations at multiple levels of genetic information are responsible for cancer development and progression. Currently, OMICs data analysis makes it possible to decipher cancer pathology in a more comprehensive manner,and is becoming one of leading focuses in cancer research. This study proposes to develop methodologies for integrative analysis of OMICs data based on matrix decomposition theory, aiming at detecting cancer gene signatures at a systems-biology level. First, we will extend the existing non-negative matrix factorization theory to study rules for joint matrix decomposition, and establish a general computational framework for gene-centered integration of multiple OMICs data. Second, we will collect prior gene association information (such as protein-protein interaction, gene regulatory networks) and integrate them into the general framework using pattern recognition techniques such as principal component analysis (PCA). Third, we will study the relationships between various OMICs data and develop supervised integrative methods for cancer gene signature detection. The study will provide theoretical bases and technical advancements for cancer diagnosis and treatment, further guide us to design anti-cancer drug, and advance personalized medicine. .
不同层次的遗传变异共同诱导了细胞的癌变。当前,多组学数据分析为理解癌症病理提供了新的契机,已经成为癌症研究的前沿焦点之一。本项目拟借助非负矩阵分解理论开展以基因为中心的多组学集成分析方法研究,从系统生物学水平上识别癌症基因信号。我们将首先依据现有的矩阵分解理论开展基于联合矩阵分解的矩阵群分解方法研究,进而结合组学数据的特点构建以基因为中心的一般性多组学集成分析框架。其次,我们将借助主分量分析等模式识别方法,融合现有的基因互作组学数据构建先验信息指导下的多组学集成模型。最后,通过引入有监督机器学习方法,挖掘多维组学间的遗传关联性,发展基于多组学集成分析的癌症基因信号识别方法。本项目所取得的研究成果将为癌症临床诊断、抗癌药物研制以及未来个性化医学的发展提供理论指导和方法学支持。
癌症,又被称作“不治之症”,严重威胁着人类的健康和生活质量。中国近20年来,每年新发肿瘤病例约312万例,平均每天8550人。从临床表现来看,癌症通常有一个漫长的发展过程,其本质特征是细胞不受控制地异常增生、甚至获得侵袭和转移能力,其中肿瘤标志物在肿瘤发生过程中发挥着极其重要作用。基于多组学数据可靠识别肿瘤标志物探索癌症分子病理已经当前医学家、数学与信息科学家研究的共同焦点之一。.本项目开展的“基于联合矩阵分解的多组学数据分析方法研究”针对当前癌症研究的前沿问题,采用新的方法和思路来探索癌症病理。具体研究内容包括提出一个通用的多维组学数据集成分析框架。该集成框架能以一种生物学可以解释的方式对不同类型的组学数据进行系统性的集成;开发基于多维组学数据的细胞癌变基因信号识别方法。.经过课题组三年的科研攻关,项目所有拟定的科研任务都已圆满完成,研究取得了预期成果:(1) 提出了两种多组学集成分析通用框架,即基于联合非负矩阵分析框架(jNMFMA)和基于基因调控概率分析框架(jGRP),实现了在基因调控空间或其他隐含癌变信号空间中的数据集成与分析。(2)提出的多种癌变基因特征模式提取计算生物学方法,实现在多组学或多个数据上进行肿瘤标志物联合识别,有效克服了数据间的可比性和兼容性问题。主持者完成项目期间,积极和学术同行进行交流,注重学生培养工作,实时了解最新科研动态,三年期间共计发表相关SCI、EI学术论文8篇。.本项目所取得研究成果不仅能够促进人们对肿瘤发生机理的理解,也为肿瘤的临床诊断与治疗以及抗癌药物研发提供相关理论基础与方法学支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
低轨卫星通信信道分配策略
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
非负矩阵分解方法及其在模式识别中的应用
基于低秩和图正则约束的矩阵分解方法研究及在癌症多组学数据中的应用
非负矩阵分解及在盲信号处理中的应用
面向致癌基因识别的多组学数据矩阵分解算法研究