Next-generation DNA sequencing technologies are enabling genome-wide discovery of somatic mutations which are highly related to cancer development that are called driver mutations. However, most mutations involved in sequencing data are not related to cancer at all that are called passenger mutations. Therefore, the major challenging problem we have to face is to distinguish those functional ‘‘driver mutations’’ important for cancer development from random ‘‘passenger mutations’’.A common approach for identifying driver mutations is to find genes that are mutated at significant frequency in a large cohort of cancer genomes. This approach is confounded by the observation that driver mutations target multiple cellular signaling and regulatory pathways. Thus, each cancer patient may exhibit a different combination of mutations that are sufficient to perturb these pathways. This mutational heterogeneity presents a problem for predicting driver mutations solely from their frequency of occurrence. We employ two combinatorial properties, coverage and exclusivity, to distinguish driver pathways, or groups of genes containing driver mutations, from groups of genes with passenger mutations. In this project, we will develop an effective and efficient algorithm with its implementation to find driver pathways from somatic mutation data. We then apply our algorithm to analyze somatic mutation data from genes in lung adenocarcinoma patients, genes in glioblastoma patients, and known mutations in patients with various cancers.
新一代测序技术使得我们可用计算机在众多癌症患者中预测那些与癌症发生发展密切相关的体细胞突变,称驱动突变。然而,更多的体细胞突变与癌症的发生发展没有关系,这类体细胞突变被称为随机突变。我们面临的挑战问题是:如何从随机突变中通过高性能计算识别与癌症密切相关的驱动突变?预测驱动突变的常规方法是寻找在大量癌症基因组中突变频繁的基因。人们发现驱动突变会同时干扰多个信号通路,这对上述常规方法提出了严峻的挑战。所以,每个癌症患者可能会有不同的突变组合都足以干扰这些信号通路。这种突变的异质性对传统上仅从突变发生的频率预测其驱动突变提出了疑问。我们将利用覆盖率和互斥性这两个组合性质来研究识别驱动信号通路的方法。本项目研究癌症患者体细胞突变的内在机制,探索其理论问题,设计快速有效的算法及软件预测体细胞突变数据中的驱动突变及驱动突变信号通路,并运用我们的算法和软件对各类癌症患者的体细胞突变数据进行分析。
研究背景:新一代 DNA 测序技术使得我们可用计算机在众多癌症患者中预测那些与癌症发生发展密切相关的体细胞突变,称驱动突变(driver mutations)。然而,更多的体细胞突变与癌症的发生发展没有关系,这类体细胞突变被称为随机突变(passenger mutations)。预测驱动突变的常规方法是寻找在大量癌症基因组中突变频繁的基因。人们发现驱动突变会同时扰动多个信号通路,这对上述常规方法提出了严峻的挑战。所以,每个癌症患者可能会有不同的突变组合都足以扰动这些信号通路。这种突变的异质性对传统上仅从突变发生的频率预测其驱动突变提出了疑问。因此,如何利用 DNA 测序数据从随机突变基因中辨认出驱动突变基因是癌症生物信息学研究领域中的重大难题之一。. 研究内容:基于基因突变数据和各类生物网络数据,研究从随机突变基因中识别与癌症密切相关的驱动突变基因的高性能计算方法,并开发相应的算法实现软件。. 主要结果:我们利用覆盖率和互斥性这两个组合性质来研究了从正常信号通路识别驱动信号通路的方法,提出一个基于网络的预测算法,命名为 CovEx。 撰写的文章发表在肿瘤研究领域的核心期刊 “Oncotarget” 上。 . 关键数据及科学意义:把 CovEx 应用于来之 TCGA 的含有12 个癌症类型的泛癌症数据,其预测结果说明我们的算法 CovEx 从各个方面远优于目前的同类算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
基于LASSO-SVMR模型城市生活需水量的预测
基于多模态信息特征融合的犯罪预测算法研究
基于二维材料的自旋-轨道矩研究进展
地震作用下岩羊村滑坡稳定性与失稳机制研究
基于多组学数据的癌症驱动信号通路的识别算法研究
癌症基因组突变谱的特征分析及其在预测癌症驱动性基因上的应用
基于高通量多组学数据的癌症驱动通路识别算法研究
整合基因突变与差异表达数据的癌症关键基因模块预测算法研究