Neuroblastoma is one of the most common tumors in children. The prognosis of neuroblastoma patients varies a lot, some with rapid progression but some with spontaneous regression. The prognostic biomarkers applied in clinical setting are still limited. Whole-genome and transcriptome sequencing can be used to explore tumors comprehensively. However, due to challenges in integration of complex information across different types of omics data, it is rare to have studies of multiple omics data measured from each individual to identify potential tumor driver genes. In this project, an analysis pipeline will be built for integrating genomic and transcriptomic alterations from whole-genome, whole-transcriptome sequences, functional data from protein function prediction and gene interaction networks. The method combines evidence from both DNA and RNA levels for identifying potential mutated driver genes. A patient-specific driver-gene score is used to capture the cumulative effect of such genes. The pipeline is applied to 498 neuroblastoma samples to identify tumor driver genes. Furthermore, we investigate whether the drive-gene score can be used to predict the survival of patients. We would generalize the integrative pipeline to be applicable to other complex phenotypes. A well-characterized true driver from multi-omics research would provide biologists with insights into cancer etiology in translational medicine and eventually contribute to personalized treatment.
作为儿童最常见的恶性肿瘤之一,神经母细胞瘤的预后差异巨大,部分肿瘤急速恶化,一些却可自然消退,其原因仍不完全明确。随着组学技术的发展,对全基因组、转录组水平的筛查,为寻找神经母细胞瘤潜在的驱动基因提供了契机。但由于缺乏针对多组学数据的标准处理流程和高效的统计分析方法,联合多组学数据寻找驱动基因的研究方法尚需完善。本项目拟以498例神经母细胞瘤为范例,通过网络富集分析法,整合全基因组、全转录组和蛋白质互作以及信号通路构成的复杂网络,利用基因突变和表达量信息互为佐证,探索对转录组具有密集调控作用的潜在神经母细胞瘤驱动基因,尝试使用个体化的驱动基因总值数估算其对疾病发展的作用,并利用病患的总体生存率验证潜在驱动基因的临床应用性。预测与肿瘤预后相关的基因组信息,将有助于阐明肿瘤的发生机制、提高肿瘤分型的准确率和治愈率,此项目的实施也将推动具有普适性的多组学数据处理标准与规范流程的建立。
作为儿童最常见的恶性肿瘤之一,神经母细胞瘤的预后差异巨大,部分肿瘤急速恶化,一些却可自然消退,其原因仍不完全明确。随着组学技术的发展,对全基因组、转录组水平的筛查,为寻找神经母细胞瘤潜在的驱动基因提供了契机。但由于缺乏针对多组学数据的标准处理流程和高效的统计分析方法,联合多组学数据寻找驱动基因的研究方法尚需完善。本项目以498例神经母细胞瘤为研究对象,通过网络富集分析法,整合全基因组、全转录组和蛋白质互作以及信号通路构成的复杂网络,利用基因突变和表达量信息互为佐证,探索对转录组具有密集调控作用的潜在神经母细胞瘤驱动基因,使用个体化的驱动基因总值数估算其对疾病发展的作用,并利用病患的总体生存率验证潜在驱动基因的临床应用性。其中,145例为高危神经母细胞瘤患者,我们整合了来自的基因表达谱,拷贝数变异以及功能性基因交互网络来检测潜在的驱动基因。每一个病人的驱动基因被整合为一个数值 (DG值), 然后通过评估驱动基因与病人存活率之间的关联来评价其临床相关性。通过对临床上定义为高风险的病人进行分析,我们鉴定出193个复发性的拷贝数变异,这些拷贝数变异与274个基因相关,有的基因变异为拷贝数增加,有的基因变异为拷贝数减少,拷贝数变异导致了基因表达水平的变化。通过进行网络富集分析,我们检测到了四个常见的驱动基因(ERCC6, HECTD2, KIAA1279, EMX2)以及66个病人特异性基因。DG值高的病人,也就是携带了更多拷贝数变异基因的病人,比DG值低的病人存活率低。除此之外,Cox比例风险分析显示,即使在校正年龄、肿瘤分期以及MYCN扩增状态之后,DG值仍旧是高风险神经母细胞瘤病人唯一显著的预后因子。通过预测与肿瘤预后相关的基因组信息,对肿瘤的发生机制、提高肿瘤分型的准确率和治愈率起到了一定提示作用。此项目的实施也推动了具有普适性的多组学数据处理标准与规范流程的建立。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
跨社交网络用户对齐技术综述
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
城市轨道交通车站火灾情况下客流疏散能力评价
融合多组学数据的原核基因组肽编码sORFs多维特征挖掘及预测
整合多组学数据研究肝癌的驱动基因及分子分型
基于多组学数据整合的疾病基因预测方法研究
基于多组学数据整合与深度学习的癌症驱动基因研究