Identifying non-random somatic copy number alterations (SCNA) in a set of cancer samples has been proved to be a valuable tool to locate cancer driver genes, the central challenge in this effort is to identify less-extreme functional SCNAs based on copy number structures. The existing computational methods usually test SCNAs in individual markers, and assess the statistical significance based on static null distributions, which might not be powerful for detecting less-extreme SCNAs. In this project, we study a genome-wide method for identifying functional SCNAs in high-resolution data. Based on an in-depth exploration of copy number structures, we create SCNA structural units to design a novel statistic for testing SCNAs, and establish a dynamic null distribution by performing permutations on the units and iteratively eliminating true positives. This scheme will reduce the conservativeness in multiple hypothesis testing, and improve the power for detecting less-extreme SCNAs. We apply the method into ovarian cancer subtypes with the purpose of identifying subtype-specific functional SCNAs and finding new potential cancer driver genes. This project-establishment will bring important theoretical and practical significance, in terms of structural mutation patterns detection, genome-wide functional SCNAs identification, and also the understanding of the association between SCNA and cancer and its application in cancer predication and treatment.
鉴定和发现癌症样本中非随机的体细胞拷贝数变异(SCNA),是查找癌症基因的重要手段,其核心问题是如何利用拷贝数的结构性变异发现甚至可能是弱显著的SCNA功能模式。现有方法大多基于单个SCNA位点和静态零分布的统计检验模型,对弱显著的SCNA的检测能力非常有限。本项目从高通量数据出发,研究全基因组SCNA功能模式的鉴定理论与方法。在深入考察拷贝数结构特性的基础上,建立基于SCNA结构单元的统计量以检验结构变异模式,通过SCNA结构单元的置换策略和循环剔除真阳性的过程建立动态零分布,解决多重检验中显著性水平估计保守的问题,以发现表面上弱显著的SCNA功能模式。应用于卵巢癌子类全基因组数据,鉴定与子类相关的SCNA功能模式并发现新的潜在癌症基因。该项目立项,对结构变异模式发现理论及SCNA功能模式鉴定技术,进而对SCNA与癌症关系的认识及其在癌症预测和诊断中的应用,都有重要的理论和实际意义。
鉴定和发现癌症样本中非随机的体细胞拷贝数变异(SCNA),是查找癌症基因的重要手段,其核心问题是如何利用拷贝数的结构性变异发现甚至可能是弱显著的SCNA功能模式。现有检测方法大多基于单个SCNA位点和静态零分布的统计检验模型,对弱显著的SCNA的检测能力非常有限。本项目从高通量数据出发,研究全基因组SCNA功能模式的鉴定理论与方法。主要研究内容包括:(1)建立基于SCNA结构单元的统计量以检验结构变异模式;(2)建立基于置换策略和循环剔除过程的动态零分布以解决显著性水平估计保守的问题,进而提高鉴定弱显著模式的性能;(3)设计拷贝数变异仿真软件并建立SCNA功能模式鉴定方法的性能评价机制;(4)应用于卵巢癌子类全基因组数据,鉴定与子类相关的SCNA功能模式并发现潜在癌症基因。重要研究结果体现在:(1)对国内外现有的癌症SCNA功能模式的检测方法作了系统的、全面的、科学的比较与分析,设计了合理的性能评价指标与方案;(2)设计了基于拷贝数变异结构单元的统计量以及基于循环剔除过程的零分布构造算法,同时结合癌症纯度预测算法,建立SCNA功能模式的一体化鉴定平台AISAIC,输出癌症纯度、显著SCNA模式、拷贝数缺失类型等重要信息;(3)将研究方法应用于TCGA数据库中569 对卵巢癌肿瘤-正常配对样本,并对其中286对具有临床信息的样本进行Early-recurrence和Late-recurrence划分,鉴定了多种与卵巢癌类别相关的SCNA模式,并对这两种类别进行了比较分析,即在Early-recurrence样本鉴定出47个SCNA模式,包含9208个基因,而在Late-recurrence样本中鉴定出23个SCNA模式,包含3388个基因,且这两个类别中有2803个相同基因;(4)建立了基于新一代测序技术的DNA变异仿真平台IntSIM,实现基因组多种变异形式(包括SCNA, SNP, CNV, INDEL等)一体化的仿真,为SCNA模式鉴定方法的改进与应用拓展提供基础。本项目的研究一方面解决多重检验中显著性水平估计保守的问题,为结构变异模式的检测提供新的思路;另一方面在全基因组规模中鉴定与癌症相关的SCNA模式及基因,对SCNA与癌症关系的认识及其在癌症预测和诊断中的应用,都有重要的理论和实际意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
基于全模式全聚焦方法的裂纹超声成像定量检测
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
黄牛重要功能基因拷贝数变异(CNV)的筛选和功能鉴定
鸡拷贝数变异(CNV)的识别与功能研究
肺动脉闭锁拷贝数变异及候选基因鉴定研究
中国汉族人群冠心病相关拷贝数变异的鉴定