基于启发式信息的肿瘤基因表达谱降维与分析方法研究

基本信息
批准号:60973153
项目类别:面上项目
资助金额:32.00
负责人:王树林
学科分类:
依托单位:湖南大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:张波云,张建国,文佳宝,卢新国,何海峰,颜军,殷志强,郭利云,张莉
关键词:
基因表达谱基因调控网络数据挖掘机器学习RNASeq
结项摘要

肿瘤是一种目前还不完全明白其发病机理的严重危害人类生命健康的分子疾病,而基因芯片与RNA-Seq技术的出现为从分子水平上研究其发病机理与临床诊断提供了强有力的手段。本课题研究了基于启发式信息的信息基因选择与特征抽取方法,设计了基于网络分量分析的调控网络构建方法。通过利用肿瘤类别信息来发现具有最高分类性能的最小基因子集并以基因在子集中的出现频数来度量基因与肿瘤的密切程度,从而能够发现重要的肿瘤相关基因;而通过基因表达谱的矩阵分解所获得的因子矩阵的统计信息来实现信息基因的选择能够满足聚类分析的要求。采用诸如因子分析与流形学习的特征抽取方法来实现基因表达谱的降维能够实现样本的可视化表示。通过对肿瘤基因表达谱结构特点的探索,能够发现肿瘤相关基因之间的调控关系与功能模块,为肿瘤分类模型构建、样本聚类分析与调控通路分析奠定基础,为最终设计肿瘤的临床诊断软件、肿瘤药物的研制以及肿瘤的个性化治疗提供依据。

项目摘要

基因芯片技术的出现为从分子水平上研究肿瘤致病机理提供了强有力的手段。我们的主要目标就是在目前公开发布的肿瘤基因表达谱数据集上开展基于启发式信息的数据降维与分析研究,发现那些肿瘤相关的致癌与抑癌基因及其相互关系,设计能够应用于肿瘤临床诊断的预测模型,以通过肿瘤相关基因调控网络的构建洞察肿瘤致病机理的本质特点。本课题组严格遵照项目计划书中所设计的各阶段计划要求进行。总体上说,我们完成了项目计划书中多数预期研究的内容和主要研究目标。首先,我们采用因子分析方法从基因表达谱中抽取潜在因子,并用抽取的因子构建预测模型,实验发现只需要很少的因子数量就能够获得足够好的分类预测性能。如果我们把这些因子解释成表达谱中一类基因的代表,由此推测可能需要很少的基因就能获得很好的预测模型。紧接着,我们根据这一推断设计了能够尽可能多地发现最佳的最小基因子集的基于启发式信息的宽度优先搜索方法的基因选择方法,这种方法采用基因在选出的基因子集中的出现频数来度量基因的重要性,进而通过这种基因重要性排序方法来发现重要的肿瘤致病基因与抑制基因。我们进一步发现选出的基因的出现频数关于基因的数量符合幂率分布,这充分表明排在前面的少数基因有可能成为肿瘤诊断的标志,通过分析选出的基因的功能、生物通路以及蛋白质相互作用网络,进一步证明我们的方法在发现重要肿瘤相关基因方面的优越性。我们还提出一种基于模板的相关滤波器方法来识别蕴含在差异表达基因中的肿瘤亚型全局模式,提出一种基于邻域粗糙集基因约简算法的集成分类器构建方法,等等,这些方法的实验结果很好。然而我们也发现采用基于水平集分割模型的肿瘤样本自动聚类方法的效果不是很好以及利用当前公开发布的肿瘤数据集构建实际的调控网络还存在一定困难。但是我们相信随着国际肿瘤基因组计划的顺利实施,更多精确的数字化肿瘤基因表达数据集的发布,对肿瘤致病机理的探索研究将会建立在新一代肿瘤基因组测序和数字化肿瘤基因表达数据的基础之上。总之,我们不仅注重尝试设计具有一定生物医学含义的数据挖掘新方法,而且注重对实验结果的生物医学分析。特别是,我们实际发表的SCI和EI检索论文数量比预期数量要多很多,而且发表的论文质量也符合项目计划书中对论文质量的要求。同时我们还申请了国家专利《一种基于启发式宽度优先搜索肿瘤相关基因的方法》一项,成功申报湖南省自然科学二等奖一项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

王树林的其他基金

批准号:51275217
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:28770362
批准年份:1987
资助金额:3.50
项目类别:面上项目
批准号:30973390
批准年份:2009
资助金额:31.00
项目类别:面上项目
批准号:31660665
批准年份:2016
资助金额:39.00
项目类别:地区科学基金项目
批准号:61472467
批准年份:2014
资助金额:62.00
项目类别:面上项目
批准号:81272249
批准年份:2012
资助金额:65.00
项目类别:面上项目
批准号:50375100
批准年份:2003
资助金额:27.00
项目类别:面上项目
批准号:11204277
批准年份:2012
资助金额:27.00
项目类别:青年科学基金项目
批准号:59875040
批准年份:1998
资助金额:17.00
项目类别:面上项目
批准号:59675016
批准年份:1996
资助金额:11.00
项目类别:面上项目
批准号:68675030
批准年份:1986
资助金额:3.00
项目类别:面上项目
批准号:61672011
批准年份:2016
资助金额:51.00
项目类别:面上项目
批准号:31060225
批准年份:2010
资助金额:24.00
项目类别:地区科学基金项目
批准号:59175164
批准年份:1991
资助金额:5.00
项目类别:面上项目
批准号:50175074
批准年份:2001
资助金额:7.00
项目类别:面上项目
批准号:50575147
批准年份:2005
资助金额:28.00
项目类别:面上项目

相似国自然基金

1

基于离散分析方法的谱图理论研究及其在高维数据降维中的应用

批准号:11601368
批准年份:2016
负责人:满守东
学科分类:A0204
资助金额:18.00
项目类别:青年科学基金项目
2

肿瘤基因表达谱数据分析及应用算法研究

批准号:11171369
批准年份:2011
负责人:廖波
学科分类:A0604
资助金额:40.00
项目类别:面上项目
3

cDNA微阵列基因表达谱遗传模型构建与分析方法的研究

批准号:30470916
批准年份:2004
负责人:朱军
学科分类:C0608
资助金额:8.00
项目类别:面上项目
4

数据缺失时高维数据降维分析的方法、理论与应用

批准号:11171331
批准年份:2011
负责人:王启华
学科分类:A0403
资助金额:40.00
项目类别:面上项目