The current paradigm of cancer biology concluded that tumours evolve through the accumulation of somatic mutations. As cancer is one of the most fatal killer of modern human life and health, cancer research owns great significance, and cancer genomics research is playing an increasingly important role. With the application of next generation sequencing technology, we aim at developing a software package for detection of somatic variation, i.e. SNP, indel and SV, based on the de Bruijn graph algorithm. The adoption of de novo assembly methods in the project would have significant improvement on coverage, sensitivity and accuracy over current popular short-read mapping based variation detection algorithms. Our approach will provide a powerful tool for the society of cancer genomic research and clinical application as well. And we will apply the software package in cancer research projects, including glioma, liver, and lung cancer, to deomonstrate its usage.
现代分子生物学认为癌症是一种基因病,细胞癌变源自于致癌突变的积累。作为现代人类生命健康的最大杀手之一,癌症的相关研究具有极其重大的意义。而癌症基因组的研究则在癌症研究中处于核心地位。本项目将运用新一代测序技术,以癌症变异检测为目的,以基于de Bruijn图的算法为基础,开发针对单核苷多态性(SNP),插入删除突变(indel),以及染色体结构性变异(SV)等各类体细胞突变变异检测方法和软件软件。本项目运用基于从头组装的算法进行变异检测,将显著优于先行以短序列回帖为主的变异检测方法,在覆盖度、敏感性和准确性方面全面提高,为癌症基因组的研究和临床应用提供强有力的支持,并实际运用于脑胶质瘤、肝癌、肺癌等癌症基因组研究项目中。
传统的变异检测策略(短序列直接比对至参考基因组序列)在鉴定遗传变异中存在一定的局限性,即只能检测参考基因组中已知的序列基因信息和检测短序列的变异。优化新的组装软件,加强对杂合序列的组装能力,通过长序列比对更加精确的定位基因位置。能够检测更加大的结构变异,降低假阳性。我们比较了SAMtools,GATK和新方法检测结果的比较,发现超过SAMtools检测的98.6%,GATK检测的99.2%的变异,使用新方法也同时检测到。.在本研究中,我们进行全基因组测序(WGS),以表征36名(数据量为:肿瘤组织:150G,正常对照样本:90G)从未吸烟的中国患者(其在45岁或以下被诊断为LUAD)的基因组变化。除了众所周知的肺癌基因(例如TP53和EGFR)之外,我们的研究还鉴定了很少报道的几种潜在的肺癌相关基因(例如HOXA4和MST1),肺癌相关拷贝数变化(例如,EGFR和CDKN2A)在我们的群组中富集(41.7%,15/36),以及肺癌相关结构变异(例如EML4-ALK,KIF5B-RET) 22.2%,8/36)。.骨肉瘤是最常见的影响儿童、青少年的健康的恶性骨肿瘤。目前主要是通过手术和新辅助化疗进行治疗,但是复发率30-40%,并且85%都为肺转移瘤,但是在临床上对骨肉瘤肺转移瘤转移模式的认识却十分有限。因此利用全基因组测序的方法,我们对10位病人的原发瘤以及其对应的转移灶,共计86块肿瘤切片进行了全外显子测序(平均深度275×)以及全基因组测序(平均深度1.77×)联合分析,结果揭示了骨肉瘤的多元化转移模式(4/10分支进化模式,6/10线性进行模式)。
{{i.achievement_title}}
数据更新时间:2023-05-31
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
基于全模式全聚焦方法的裂纹超声成像定量检测
基于图卷积网络的归纳式微博谣言检测新方法
人工智能技术在矿工不安全行为识别中的融合应用
面向工件表面缺陷的无监督域适应方法
检测基因组上氧化损伤准确位置的高通量测序方法的开发和应用
基于自组装参考基因组的高通量长读测序数据压缩和比对集成研究
基于从头组装的参考基因组和种群重测序研究红面猴进化历史及近缘物种的渐渗杂交机制
基于多参考基因组的高通量测序片段映射方法研究