Gene expression data analysis is helpful for finding new method of disease diagnosis and treatment, and helpful for deeply understanding the complicated gene regulation. In order to sufficiently mine the knowledge in gene expression data, in this research, we will study the following terms: (1)Using the "sparse attribute" of gene regulation, integrating the characteristic of gene expression data, to form the L1-norm constraint. Based on which, the novel sparse matrix decomposition algorithm suit for gene expression data will be proposed.(2)Using the sparse factor of tumor gene expression data matrix, combining the prior information of gene regulation, to cluster the tumor samples and provide the basis for tumor diagnosis and treatment. (3) To identifying the transcriptional modules by clustering the genes based on the sparse factor of model organism gene expression data matrix. (4) Using ChIP-chip data to initialize the sparse matrix decomposition for model organism gene expression data, then using the connectivity strength factor matrix of which to reconstruct the gene regulatory network.
基因表达谱数据分析能够帮助人们建立新的疾病诊疗方法,深入了解复杂的基因调控关系。为充分挖掘基因表达谱数据中蕴含的信息,本项目中,我们拟开展以下研究:(1) 结合基因表达数据特点,利用基因只被一小部分调控因子调控的"稀疏性",形成L1-范数约束条件,设计出适合基因表达谱数据的稀疏矩阵分解算法;(2)利用肿瘤基因表达谱数据矩阵的稀疏分解因子,结合基因调控的先验信息,对肿瘤样本进行聚类分析,为肿瘤临床诊断和治疗提供科学依据;(3)利用模式生物基因表达数据矩阵的稀疏因子,对基因进行功能聚类分析,发现具有特定功能的转录模块;(4)利用ChIP-chip数据,形成基因表达谱数据稀疏矩阵分解的初始化条件,对模式生物基因表达谱数据矩阵进行分解,并根据所得到连接权值因子矩阵初步构建一些简单模式生物的基因调控网络。
本项目针对基因表达谱数据分析问题,围绕高维小样本数据降维、功能基因聚类、差异表达基因模块识别、癌症相关基因及调控通路识别等方面展开研究,取得了一系列重要研究成果。在基于约束性学习的肿瘤基因表达谱聚类分析方法方面,考虑基因表达调控的稀疏性,提出了多种功能基因聚类方法;融合基因表达数据的生物特性,提出几种有效的降维方法,对肿瘤样本数据进行分类分析,提高了分子水平上进行肿瘤诊断的准确性。根据生物病理知识,多基因相关复杂性疾病往往伴随着差异表达基因模块,准确识别这些模块,有利于复杂疾病的诊断与治疗。本项目在对基因表达谱数据进行稀疏性分解的基础上,提出了多种疾病相关差异表达模块识别方法。生物医学最新进展表明,癌症病变往往伴随着相关的基因突变,但大部分基因的突变属于“乘客突变”,只有少部分“司机突变”与癌症密切相关,本项目在融合生物医学知识的基础上,提出了多种司机突变基因及通路识别方法。本项所取得的研究成果,能够在一定程度上推动肿瘤医学的发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
具有随机多跳时变时延的多航天器协同编队姿态一致性
基于直观图的三支概念获取及属性特征分析
含饱和非线性的主动悬架系统自适应控制
基于动力系统的L1范数矩阵低秩分解及其应用研究
面向癌症基因组图谱数据分析的稀疏矩阵分解方法研究
基于L1范数的鲁棒稀疏特征抽取算法研究
l1范数约束下的自适应滤波算法及其在稀疏系统辨识中的应用