Previously reported prognostic signatures for predicting the risk of recurrence and prognoses of postsurgical hepatocellular carcinoma (HCC) patients are commonly based on predefined risk scores. Such signatures are hard to be directly applied to clinic because they are vulnerable to the measurements of batch effects and the variations among individuals. Based on the relative expression orders (REOs) of genes which are resistant to batch effects, we have identified a prognosis signature which could robustly predict the disease-free survival and overall survival of HCC patients measured from different platforms and different laboratories. Here, we will first optimize the signature and identify the key drivers of different prognoses based on the multi-omics data of The Cancer Genome Atlas (TCGA) samples and the robustness of the signature . Then, based on the robustness of the REOs of genes, we will develop bioinformatics methods to evaluate the relationships between HCC cell lines and clinical HCC tissues, identify the proper cell lines for high-risk samples of HCC, validate the results from clinic HCC tissues in molecular level by applying our developed method for analyzing small sample size cell lines, explore the key molecular mechanism with high coverage leading to different prognosis. Results of this research would discover the potent drug target of improving patients' prognoses and afford theoretical basis for clinical drug treatments.
现有的预测早期肝细胞癌(HCC)术后复发风险、预后的基因标志通常基于基因的表达值构建风险得分。但是,此类标志容易受基因表达值检测的批次效应和个体间变异的影响,难以应用到临床。利用对批次效应不敏感的基因表达的相对大小关系,我们已经识别出能够在多组来自不同平台、不同实验室的数据集中准确预测HCC复发风险的分子标志。本课题拟进一步优化该标志;利用此类分子标志的跨数据集稳健性能及TCGA中HCC样本的多维组学数据,进一步识别高风险预后亚型的关键驱动基因。然后,利用稳健的基因表达相对大小关系,发展生物信息学方法鉴定肝癌细胞系与临床组织(亚型)的相关性,并识别具有高风险肝癌亚型特征的肝癌细胞系,应用我们已发展的分析小数据细胞系的方法,在细胞分子水平验证高风险预后亚型的关键驱动基因,探索导致不同预后的高覆盖的关键分子机制,据此发现改善患者预后的潜在药靶,为临床药物治疗提供依据。
早期肝细胞癌(Hepatocellular carcinoma, HCC)的术后复发是导致其预后较差的主要因素,识别导致不同预后复发风险的关键驱动基因并通过细胞实验进行验证,对理解HCC的发展机制和改善患者生存有重要意义。本项目主要对以下4个方面进行了研究:(1)评估了肝癌细胞系与临床HCC组织的相似性;(2)开发了基于可重复评价识别癌对正常组织的差异高表达基因算法(PD)和小样本技术重复细胞系组间差异表达基因算法(CellComp);(3)识别了基于基因表达量的相对大小关系(秩次)的HCC早期诊断的转录组定性分子标志;(4)识别了导致HCC复发亚型的关键驱动基因。重要结果:(1)利用基因的秩次关系,分别比较了HCC组织和六种常发生肝转移的癌型(结肠癌、乳腺癌、胃癌、非小细胞肺癌、卵巢癌、胰腺癌)的转录组表达谱数据,获得了HCC特异的基因对,并进一步评估了CCLE数据库中的24个肝癌细胞系,发现8个肝癌细胞系(Huh-7, Huh-1, HepG2, Hep3B,JHH-5, JHH-7, C3A 和Alexander cells)和临床HCC组织更相似,可以用于后续的细胞实验研究,而其他16个肝癌细胞系的来源存在不确定性;(2)开发的基于可重复评价识别癌对正常组织的差异高表达基因算法PD,可以对现有的识别差异表达基因算法进行有效的补充,发现很多容易被传统算法遗漏的差异高表达基因;基于基因秩次的个体化差异基因识别算法,开发的小样本技术重复细胞系组间差异表达基因算法CellComp比传统的SAM、limma、RankProd算法展现出更高的敏感性和准确性;这两种算法可以用于分析小样本的细胞系表达谱数据。(3)识别的由19对基因构成的HCC早期诊断的分子标志,即使在采用取样不准确的微量活检样本(癌旁正常或癌旁肝硬化)中,也可以成功地将HCC及癌旁组织与非HCC患者的肝硬化组织区分开来,并且比现有的临床诊断技术具有更高的敏感性,有助于HCC的早期诊断、改善预后;(4)利用RankComp个体化分析算法识别了111个在高、低复发风险HCC样本中发生差异甲基化但方向相反的高频基因,进一步利用蛋白质互作网络,从中筛选了4个导致HCC不同预后的关键基因(IFNG、LYN、CREB1,SPP1),为理解肝细胞癌不同预后的分子机制提供理论基础,也可以为临床药物治疗提供潜在的药靶。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
肥大细胞亚型鉴定和激活特征
宫颈癌发病相关病毒HPV亚型筛查及下调机制的研究
基于循环肿瘤细胞捕获的肺癌早期诊断及CTC亚型的分子特征差异研究
广西黄曲霉毒素-乙型肝炎病毒双暴露原发性肝细胞癌亚型的全外显子多态性特征筛查及其功能鉴定