基于聚类集成算法的癌症基因表达数据模式发现新框架的研究

基本信息
批准号:61003174
项目类别:青年科学基金项目
资助金额:18.00
负责人:余志文
学科分类:
依托单位:华南理工大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:马千里,韦佳,蒋昌金,蔡先发,林古立,余国先,严桂夺,吴广财,林良思
关键词:
聚类集成算法癌症基因表达数据模式发现
结项摘要

在生物和医学的研究中采用基因矩阵技术为癌症的诊断和治疗提供了一条新思路。发现不同癌症的类型和准确地对癌症样本进行分类是成功地诊断和治疗癌症过程中非常重要的一环。发现癌症类型的任务由两个具有挑战性的子任务组成:(1) 在给定的基因表达数据里, 能够正确地估算出有多少种类型;(2) 能够准确地将样本分配到相应的类型。在这个项目中,我们提出了一个新的模式发现框架。该模式发现新框架包括了一种基于变换函数和扰动函数的新集成器生成技术,一种基于信心指数的新聚类集成算法和一种新聚类有效性指标。新集成器生成技术将采用变换函数和扰动函数来提高集成器的多样性和代表性。新聚类集成算法将对集成器中的聚类结果赋予相应的信心指数,以此来反映它们与原基因数据结构特性的吻合程度。新聚类有效性指标将同时考虑集成器中聚类结果对指标的影响程度和信心指数,集成器中聚类结果之间的相关程度,以及类型个数和样本维数的影响。

项目摘要

在生物和医学的研究中采用基因矩阵技术为癌症的诊断和治疗提供了一条新思路。而基因数据集的挑战在于数据集不但包含了大量的基因数据,而且包含了大量的噪音数据。我们提出了基于三次谱聚类的聚类集成框架,并将其应用在癌症基因表达数据模式发现中。该框架运用谱聚类算法不但对基因维和样本维进行聚类,而且对一致性矩阵进行分割,并在实验中取得很好的效果。虽然癌症模式发现的方法很多,很少研究人员同时考虑到在癌症聚类过程中同时运用硬聚类和软聚类。我们把模糊理论引入到聚类集成框架中,提出了四种不同的混合模糊聚类框架用于癌症基因表达数据的模式发现。相似性测量是从基因表达数据中进行癌症发现很重要的一环,也是聚类集成算法的重要影响因素。我们设计了一个相似性衡量指标,称为代表性距离,用于识别基因表达数据中不同的癌症样本,并在癌症数据集的实验上取得了很好的效果。提出了基于随机组合数据映射操作的混合聚类集成框架,该框架集成了不同维度下的随机组合数据映射操作、混合聚类技术、信心指数和图论规范切算法。新框架在癌症基因表达数据的模式发现中取得了很好的结果。此外,我们在癌症模式发现、聚类集成算法、半监督集成算法等方面进行了探讨,取得了一定成果。项目中已发表和已接收论文35篇,其中有16篇被SCI期刊收录。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
5

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021

余志文的其他基金

批准号:61572199
批准年份:2015
资助金额:65.00
项目类别:面上项目

相似国自然基金

1

基于算法选择的聚类统一框架研究

批准号:61175054
批准年份:2011
负责人:钟才明
学科分类:F0603
资助金额:56.00
项目类别:面上项目
2

基于多视图学习的癌症多组学数据聚类方法研究

批准号:61906198
批准年份:2019
负责人:刘健
学科分类:F0603
资助金额:22.00
项目类别:青年科学基金项目
3

基因表达数据中的二维模式发现方法研究

批准号:60575014
批准年份:2005
负责人:张学工
学科分类:F0304
资助金额:23.00
项目类别:面上项目
4

面向多源异构流数据的在线聚类集成算法研究及其应用

批准号:61602189
批准年份:2016
负责人:黄栋
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目