Accumulation of genetic alterations results in transformation of normal cells to cancer cells. However, as the extensive focus, genes encodeing proteins account for only 2% of genome. Recent studies showed that the dysregulation of lncRNAs play a critical roles in the tumorigenesis. Thus, exploring driver mechanisms of genetic alterations in the non-coding genome regions in tumorigenesis will provide new insight for understanding the complex regulatory mechanism in cancer. Here, this project integrates multi-omics data, including genome, transcriptome and epigenome, multilayer regulate network, lncRNA-gene association and functional data,to identify the cancer driver lncRNAs and their mechanism in the cancer hallmark pathways based on the multilayer factor-mediated dysregulated network induced by genetic alterations of lncRNAs, identify the common and specificity of driver lncRNAs among multiple cancers and subtype-specific lncRNAs using the pan-cancer analysis and verify functions of lncRNAs using biological experiments. Finally, we develop a comprehensive bioinformatics platform for integration of multi-omics, identification of driver lcnRNAs and characterization of their functional mechanism in cancers. Together, the identified driver lncRNAs and the multilayer factor-mediated cascade reaction provide new clues in understanding the cancer pathogenesis and provide new biomarkers and potential therapeutic targets, and have promise potential clinical applications.
累积的遗传改变驱使正常细胞向癌细胞转变。广泛的焦点集中于蛋白编码基因,而其仅占基因组的2%。最近的研究表明lncRNA异常在癌症发生中起着关键作用。因此,探索基因组非编码区域的遗传改变在癌症中的驱动机制为理解癌症复杂调控机制提供新的视角。本课题整合基因组、转录组、表观组、多重调控网络、lncRNA-gene关联组以及功能组等多组学数据,基于lncRNA遗传改变所诱导的多因子介导的失调网络识别多种癌症驱动lncRNA并刻画lncRNA在癌症hallmark通路上的驱动机制,利用泛癌分析识别多种癌症间驱动lncRNA的聚集性与发散性,识别不同癌症亚型相关的驱动lncRNA,形成多组学数据整合分析,多种癌症驱动lncRNA的识别、功能特性的刻画以及驱动模式分析于一体的综合性生物信息学分析平台。本研究识别的驱动lncRNA及其引起的级联反应为理解癌症的发病机理增添新的线索,为癌症的诊断与治疗靶点。
累积的遗传改变驱使正常细胞向癌细胞转变。癌症群体中遗传改变的广泛复杂性和高度的异质性使得识别驱动癌症关键因子成为挑战。同时,非编码区域占据基因组的绝大部分区域,探索基因组非编码区域遗传改变在癌症中的驱动机制为理解癌症复杂调控机制提供新的视角。本项目设计了生物信息学方法策略通过整合多维组学(基因组、转录组、互作组和调控网络)数据识别多种癌症的驱动关键因子及刻画驱动因子所诱导的失调机制。基于“具有表达相似模式的lncRNA与编码基因具有相似功能”与“相似表型关联的不同疾病呈现相似的分子机制”的关联有罪机制,我们设计了优化算法通过整合lncRNA-基因共表达网络与疾病表型相关性,利用信息传播随机游走算法优化癌症风险lncRNA和基因并将该方法应用到了14种癌症类型。进一步融合竞争内源性RNA机制,通过整合lncRNA表达谱、基因表达谱、miRNA表达谱、ceRNA调控网络与遗传改变谱设计一个基于遗传改变诱导的失调网络识别在癌症中发挥关键作用lncRNA/基因的方法策略。将该方法应用到12种癌症类型,刻画癌症亚型与癌症间的共性和特异性。同时,连续引入关键基因遗传改变提供一个更好的方式来刻画关键因子的驱动机制。基于连续遗传改变的转录组数据能够帮助我们对癌症进展动态过程进行建模,通过比较连续遗传改变的转录组数据与癌症组织转录组数据动态刻画疾病发生机制,优化了不同组合的关键驱动因子指导癌症建模。同时,我们设计了识别细胞的关键基因数据库。本研究通过整合多维组学数据识别驱动关键因子的方法和策略对于理解癌症的发病机理增添新的线索,为癌症的诊断与治疗靶点。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
低轨卫星通信信道分配策略
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于二维材料的自旋-轨道矩研究进展
基于多组学数据整合的癌症驱动突变识别
长链非编码RNA遗传变异驱动的癌症个性化通路区域识别及癌症异质性分析
整合多组学数据系统识别调控免疫事件进而驱动癌症转移的关键因子
癌症表达谱数据分析及癌症相关的长链非编码RNA LncRNA19功能机制的研究