整合基因突变与差异表达数据的癌症关键基因模块预测算法研究

基本信息
批准号:61902390
项目类别:青年科学基金项目
资助金额:25.00
负责人:高勃
学科分类:
依托单位:首都医科大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
预测算法生物信息学基因突变功能模块基因差异表达
结项摘要

The international cancer genome projects such as The Cancer Genome Atlas (TCGA) have generated the whole-genome and whole-exome mutation data, DNA copy number variation data, promoter methylation data and mRNA differential expression data for a large number of tumor samples of different cancer types. A major goal of the projects is to identify key genetic alterations and functional modules and discover therapeutic targets through comprehensive genomic analysis. The cancer signaling pathway theory holds that cancer is driven by the dysfunction of pathways which can be caused by one mutation in the pathway. The theory can also be used to explain the extreme heterogeneity of cancer mutations. Along with the mutations and dysfunction of pathways, the gene expressions can also be abnormal. Comprehensive analysis of different types of data can overcome the limitation in analysis of single type of data. However, there are serious computational challenges in integrated analysis of different types of data. In this project, we devote to study the theoretical problem in the integration of different types of data including cancer mutations, mRNA differential expressions and protein-protein interaction networks, and further design reasonable and effective algorithms and software with the implementation for systematic analysis of cancer critical genes and functional modules.

癌症基因组图谱计划(TCGA)等国际癌症基因组项目已经对不同类型的肿瘤样本测序生成了全基因组和外显子组突变数据、拷贝数变异数据、启动子甲基化数据以及基因差异表达数据等。这些项目的重要目标是通过综合的基因组分析识别癌症的关键基因突变和功能模块,并发现相应的治疗靶点。癌症的信号通路理论认为,癌症由信号通路的功能异常所驱动,而信号通路上的任意一个基因的突变都足够导致其功能异常。这个理论也被用于解释癌症突变数据的极端异质性。伴随着基因突变以及信号通路的功能异常,相应的基因表达等同样会表现出异常。对不同类型数据的综合分析有助于克服单一类型数据分析的局限,然而却在计算上面临严峻的挑战。本项目结合蛋白质相互作用网络数据分析癌症基因组突变数据与基因差异表达数据,研究不同类型数据整合中的理论问题,并设计合理有效的算法和软件实现对不同类型数据的系统分析,识别癌症关键基因和功能模块。

项目摘要

本项目研究整合基因突变与差异表达数据的癌症关键基因模块预测算法。为深入理解不同数据类型的性质,我们先分别对两种类型数据进行分析。对基因突变数据集,本项目开发了一种新的识别不同癌症类型之间公共驱动基因模块以及信号通路的ComCovEx方法。对基因表达数据集,我们利用t-test算法与DESeq2算法进行群体层面的差异表达基因分析,并发现利用这两种方法为每个癌症的每个基因计算出的差异表达显著性p值大小与这个基因是否为NCG癌症基因没有关联。基于对这两种不同类型数据集的分析和理解,本项目开发了一种基于患者个体水平差异表达基因分析的整合基因突变数据、基因表达数据以及蛋白质交互作用(PPI)网络数据的预测癌症驱动基因及功能模块、信号通路的新方法。我们将新方法应用于TCGA数据库11种不同癌症,并与其它基于频率的、基于功能的和基于网络的7种前沿算法比较。研究结果表明,在NCG癌症基因或CGC癌症基因基准下,新方法在识别癌症驱动基因方面优于前沿方法。另外,新方法的预测结果对方法参数和PPI网络具有鲁棒性。富集分析表明,新方法可以发现其他方法遗漏的新的驱动基因、功能模块或信号通路。新方法将有助于更好地理解癌症致病机理、识别癌症诊断和治疗靶点,推动癌症患者个性化护理的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020

高勃的其他基金

相似国自然基金

1

基于多组学数据整合与深度学习的癌症驱动基因研究

批准号:61902126
批准年份:2019
负责人:杨海
学科分类:F0213
资助金额:25.00
项目类别:青年科学基金项目
2

多组学数据整合分析癌症细胞生存必需基因

批准号:31801110
批准年份:2018
负责人:梅胜林
学科分类:C0608
资助金额:27.00
项目类别:青年科学基金项目
3

基于数据整合的计算癌症基因组学研究

批准号:61379092
批准年份:2013
负责人:张世华
学科分类:F0213
资助金额:77.00
项目类别:面上项目
4

基于聚类集成算法的癌症基因表达数据模式发现新框架的研究

批准号:61003174
批准年份:2010
负责人:余志文
学科分类:F0213
资助金额:18.00
项目类别:青年科学基金项目