Copy number alterations (CNAs) are undiscovered "dark matter" among the variants in cancer genome, and are especially critical in illustrating the etiology of caner and developing efficient strategy for cancer diagnosis and treatment. Currently, next generation sequencing (NGS) is attracting a lot of attention and provides a huge promise to CNA studies. However, the corresponding computational method is very inadequate. This project aims to investigate novel methodologies and ideas in the identification and analysis of CNAs, by using NGS data from breast cancer and other common cancers. We plan to examine batch effect and develop comprehensive strategy for read depth signal correction. Moreover, based on the theoretical study of global parameter modeling, we plan to develop novel computational methods for identifying CNAs in heterogeneous tumor samples. To address the issue of discovering pivotal variants in cancer, we firstly propose a novel idea by detecting cancer subgroups and their recurrent CNAs, and then by using molecular network as a breakthrough, we introduce the novel concept of information fusion of molecular network and mutual exclusivity in variants. By this way, we plan to develop novel computational discovery approaches, and illustrate pivotal CNAs in common cancers and the associated functional modules in molecular network. With great theoretical significance and application value, this project will provide key theoretical foundation and computational methods for NGS-oriented study of CNAs in cancer, and will provide scientific evidence for illustrating the molecular mechanisms associated with CNAs in cancer development and progress.
拷贝数异常是癌症基因组变异中尚未阐明的“暗物质”,对揭示癌症致病机制并发展有效诊疗手段极为关键。目前备受关注的新一代测序在拷贝数异常研究中前景巨大,但相应的计算手段十分匮乏。本项目以乳腺癌等常见癌症的新一代测序数据为对象,研究在拷贝数异常检测和分析中的新方法与新思路。拟研究批次效应并发展全面的读深信号矫正策略,进一步通过全局化参数建模的理论研究,发展异质性肿瘤中拷贝数异常的全新检测方法。针对癌症关键变异的发现难题,率先提出识别癌症中不同子群及其频发拷贝数异常的新颖思路,在此基础上以分子网络为突破点,首次引入分子网络与变异互斥性的信息融合理念。通过发展全新的计算发现手段,揭示常见癌症中的关键拷贝数异常及相关网络功能模块。本项目将为面向新一代测序的癌症拷贝数异常研究提供关键的理论基础和计算手段,并为阐明关键拷贝数异常在癌症产生和发展过程中的分子机制提供科学依据, 具有重要的理论意义和应用价值。
本项目从癌症基因组的新一代测序读深信号校正、异质性肿瘤中拷贝数异常的全局化建模、异质性癌症不同子群中频发拷贝数变异的识别、常见癌症中的关键拷贝数异常及相关网络功能模块的生物学功能分析和应用四个方面开展了较为深入的研究。首先探究了WES数据中相对读段深度(RRD)信号的统计性质,并提出了拷贝数与 RRD 之间的定量关系和相应的校正公式,并在此基础上提出了针对肿瘤样本WGS数据的有效信号校正策略。进一步通过对肿瘤样本中多个克隆群体的拷贝数异常分析,分别设计了CLImAT-HET和CloneCNA两种基于阶乘隐马尔科夫模型和贝叶斯信息准则的异质性肿瘤拷贝数变异检测方法,可以在高异质性肿瘤中准确检测出不同的癌症克隆群体及各癌症克隆特异性的基因组拷贝数异常。. 针对异质性癌症不同子群中频发拷贝数变异的识别问题,提出了基于一种基于非负稀疏奇异值分解的异质性癌症拷贝数变异识别方法NN-SSVD,通过检测CNA在部分样本中的变异频率,从而有效识别异质性癌症中相对低频的RCNA。进一步提出带样本权重约束的矩阵分解方法HetRCNA,可从异质性癌症基因组数据中准确发现亚群特异性RCNA,从而较好地解决了异质性癌症的复杂模式RCNA中含有不同癌症亚群特异性RCNA这一难题。. 从驱动变异常作用于相同的基因功能通路这一现象出发,本项目分别提出了针对异质性癌症的新型驱动变异相关基因发现方法IntDriver和泛癌驱动变异相关基因发现方法PanDriver。上述方法均基于带有正则化的矩阵分解框架,引入与潜在驱动变异相关的基因网络信息,有效促进了癌症驱动变异相关基因的识别。研究中还针对拷贝数变异等组学数据,通过结合基因网络信息,积极挖掘和分析变异基因相关的潜在疾病信息。此外,提出了一种将基因组变异通过基因功能网络进行低维表征的新颖方法NRL2DRP。此外,研究中通过将拷贝数变异等癌细胞分子层面信息和癌症病理层面信息有效融合,提升了预后预测的准确性。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
基于全模式全聚焦方法的裂纹超声成像定量检测
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
面向测序技术的外显子组拷贝数变异检测算法研究与应用
基于家系基因组测序数据的拷贝数变异检测方法研究
基于下一代测序技术的重复基因结构及拷贝数目变异与癌症关联性研究
癌症体细胞拷贝数变异功能模式的鉴定方法与应用研究