Identification and functional analysis of driver gene is a main challenge in the study of hepatocellular carcinoma (HCC), which would promote the molecular classification and treatment. Our previous studies and public literatures showed that single nucleotide mutation, copy number variation and abnormal DNA methylation may cause HCC by regulating gene expression. But because of the limitation of data and analysis method, current researches of HCC driver genes remain in the single data level, ignoring the combined effect of different gene variations. Here we integrate the multiple-omics data of HCC to identify drive gene by Bayesian network modeling, analyze gene functions and related biological pathways, and verify the functions of new driver genes by in vitro experiments. Additionally, we utilize drive genes to develop a new HCC classification method, and explore the association between HCC subtypes and clinical features. Our results will help to clarify the molecular basis of tumor heterogeneity, reveal the pathogenesis of HCC and promote personalized treatment. The data integration algorithm is also suitable for other cancers, which will accelerate the application of big data in caner research.
肝癌驱动基因筛选及其功能研究是肝癌发生机理研究的关键,找到驱动基因后癌症的分型和治疗就事半功倍。本课题组的前期研究和文献调研表明:单核苷酸突变、拷贝数突变和异常甲基化都可能通过影响基因表达而驱动肿瘤的发生。但由于数据和分析方法的限制,肝癌驱动基因的现有研究仍停留在单一的数据水平,忽略了不同类型的基因变异对肝癌发生的系统效果。本项目拟整合肝细胞癌多层次的组学数据,通过贝叶斯网络建模系统地鉴定肝癌驱动基因;分析驱动基因的功能和相关生物学通路,并结合体外实验检验新驱动基因在肝癌中的功能。同时从最根本的驱动基因出发建立肝癌分子分型的新方法,探索不同亚型与生存等临床特征的相关性。本项目的研究结果对于阐明肝癌异质性的分子基础,揭示肝癌的发病机制和推动个性化治疗具有重要的意义。项目所建立的多组学数据整合方法也可拓展到其它肿瘤,加速生物大数据在肿瘤学研究中的应用。
肝癌驱动基因筛选及其功能研究是肝癌发生机理研究的关键,找到驱动基因后癌症的分型和治疗就事半功倍。本项目整合了TCGA中377个肝细胞癌患者的多层次组学数据,通过贝叶斯网络建模系统地发现了384个肝癌驱动基因,这些基因中少部分是传统的基因组层面发生了突变基因,大部分是基因表达改变的驱动基因。这些驱动基因显著富集了cancer hallmarks相关的通路,通路内多个基因的变异存在互斥现象。根据驱动基因各组学显著差异大小,基因高低表达对生存影响,参与的生物学通路等条件,我们筛选了2个驱动基因在肝癌细胞系中验证功能,其中1个基因敲除后会显著降低肝癌细胞系的增殖。基于驱动基因把肝癌分成了4个亚类,分型结果可以有效的把生存状况区分,其中亚型3的生存状况较好,亚型2的生存状况最差。本项目的研究结果对于阐明肝癌异质性的分子基础,揭示肝癌的发病机制和推动个性化治疗具有重要的意义。项目所建立的多组学数据整合方法也可拓展到其它肿瘤,加速生物大数据在肿瘤学研究中的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
跨社交网络用户对齐技术综述
基于多组学数据整合与深度学习的癌症驱动基因研究
基于多组学数据整合的癌症驱动突变识别
多组学数据整合分析癌症细胞生存必需基因
基于多组学数据整合的疾病基因预测方法研究