拷贝数异常是肿瘤基因组的重要特征,对研究癌变产生和发展过程、癌症的临床诊断及治疗、抗癌药物的开发具有重要意义。作为目前拷贝数异常的最新检测技术,单核苷酸多态性微阵列具有基因组水平分辨率高的优点,但易受到肿瘤自身特性及噪声等因素的影响,因此检测精度亟待提高。本课题拟从统计建模的角度出发,深入研究并解决:(1)临床对照实验中拷贝数异常的变化;(2)肿瘤-正常组织连配数据的利用;(3)肿瘤中多个癌细胞克隆的存在;(4)检测中不适定情况的识别这四个拷贝数异常检测技术研究中的热点和难点问题。相关的研究工作将以GPHMM统计框架为基础,从生物学角度分析以上问题对微阵列数据处理造成的影响,通过发展新颖的统计模型及模型训练和参数估计算法,有效提高拷贝数异常检测的性能。在此基础上,通过开发适用于复杂情况、满足不同实际需求的生物信息学软件工具,完善基于SNP-array的高通量全基因组肿瘤拷贝数异常检测技术。
拷贝数异常在癌症研究方面具有重要意义。包括单核苷酸多态性微阵列、新一代测序等目前流行的高通量技术易受到肿瘤自身特性及噪声等因素的影响,因此给全基因组拷贝数异常检测带来了很大的挑战。本项目从统计建模的角度出发,对基于上述高通量实验技术的肿瘤全基因组异常检测中的一些关键理论问题进行了深入的研究。对于肿瘤异质性情况下的拷贝数异常检测,提出了反映肿瘤中不同克隆拷贝数异常的肿瘤多克隆混合模型,在此基础上发展了基于SNP array的异质性肿瘤拷贝数异常检测方法,不仅可以检测肿瘤存在的多种不同的癌细胞克隆,而且可以对克隆间共有或独有的拷贝数异常及杂合性缺失进行准确检测。在新一代全基因组的肿瘤数据分析中,通过参考基因组信息提取出测序读深和等位基因频率信号,并发展了对上述信号较为完善的预处理技术和具有国际领先水平的检测方法。此外,在成对SNP array数据的建模研究中,利用正常组织基因型等信息对GPHMM的建模方式进行改进,有效提高了对拷贝数异常检测的鲁棒性,并在此基础上发展对肿瘤基因组复发变异的统计显著性分析方法,通过对乳腺癌、肝癌的数据分析,发现了肿瘤基因组上大量的复发异常区域及癌症相关基因。为准确检测赫赛汀临床治疗对照实验中拷贝数异常的变化,在研究中发展了一种基于多元方差分析的有效分段算法。针对肿瘤拷贝数异常检测中的不适定问题,提出利用信息熵作为不适定问题的有效检测指标并取得了很好的效果。上述研究成果为基于高通量实验技术的肿瘤拷贝数异常检测提供了更为完善的理论方法和多种有效的生物信息学工具。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
五轴联动机床几何误差一次装卡测量方法
基于全模式全聚焦方法的裂纹超声成像定量检测
肿瘤细胞线粒体DNA拷贝数异常改变的分子基础研究
行为异常的多模态检测机制与算法研究
面向新一代测序的癌症拷贝数异常检测及其关键变异的计算发现研究
基于约束型读段深度策略的肿瘤DNA拷贝数变异检测方法研究