泛癌体细胞突变热点分析算法研究

基本信息
批准号:31771466
项目类别:面上项目
资助金额:56.00
负责人:牛北方
学科分类:
依托单位:中国科学院计算机网络信息中心
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:郎显宇,李文梅,崔建涛,李瑞琳,何小雨,夏楠,陈玮,李晓东
关键词:
泛癌突变基因组大数据突变热点癌症基因组
结项摘要

Local concentrations of mutations, so-called mutation hotspots, are well-known in human cancers. However, they are incompletely understood, especially their spatial relationships in protein 3-D structure and the detection of significantly mutated residues have not yet been deeply explored and applied. Currently, the functional study of somatic mutations is mostly performed by traditional experimental analysis and the detection of significantly mutated genes. The systematic analysis of large-scale somatic mutations derived from pan-cancer study and its effect on protein structure and cancer initiation and progression is still on the initial stage. To further investigate cancer somatic mutation hotspots, we intend to conduct this study from these two perspectives. We will develop algorithms on the detection of significantly mutated residues and study the specificity of frequent mutations. We will develop high precision algorithms for protein structure based Pan-Cancer significant mutation hotspots discovery and validate the relevant key candidate molecules by biological experiments. With the incorporation of bioinformatics and cancer genomics methods, this study attempts to raise new possibilities for identifying rare functional mutations and potential druggable targets. These findings will provide important theoretical and practical guidance on cancer therapies in both clinical trials and drug development.

基因突变的局部聚集,也称为突变热点,是人类癌症中所熟知的现象,但这种跨癌症类型的体细胞突变热点现象还没有被完全理解,尤其是显著突变残基的探测及蛋白质结构下体细胞突变间的空间关系还没有被深入的研究和应用。目前癌症体细胞突变在功能层面的研究,主要集中在显著突变基因的识别,在蛋白质结构中的相互作用也多限于实验验证,大规模泛癌体细胞突变对蛋白质结构、癌症发生和发展过程影响的整体分析研究才刚刚开展。为进一步研究癌症体细胞突变热点,本研究拟采用生物信息学和癌症基因组学相结合的分析方法,研究高分辨率显著突变残基的探测算法及频发突变特异性,研究基于蛋白质结构下泛癌体细胞显著突变热点的高精度识别算法,并选取重要热点进行功能实验验证,从而发现驱动肿瘤发生发展的罕见功能突变及潜在的药物靶点,对癌症的临床治疗和抗癌药物的研发都具有重要的理论和现实意义。

项目摘要

驱动突变是使癌细胞具有生长优势并被积极选择的重要原因。当前跨癌症类型的驱动突变残基,尤其是复杂结构变异的识别及其在蛋白质三维空间结构下的相互作用关系还没有被深入研究。因此,本项目旨在研究泛癌体细胞突变热点的空间分析算法,有利于准确识别新的驱动突变,助力破解癌症发病机制,发现可成药位点,实现肿瘤个性化治疗。在本研究中,我们首先调研分析了基于蛋白质空间结构的突变热点分析算法及其性能,结合评审专家的意见,将结构变异和点突变进行热点融合,提出了基于机器学习的基因组微卫星不稳定性和白血病基因组FLT3-ITD探测的新计算方法,建立了中国人肿瘤突变数据库,实现了点突变和结构变异探测的工作流软件系统。而后,围绕泛癌体细胞突变热点全景观,我们从突变热点聚类算法和在线突变热点分析服务器两个角度展开研究,首先对ICGC及中国人泛癌体细胞突变数据进行收集和清洗,从数据预处理方法、空间聚类方法及显著性判定进行了性能比较和算法优化。发现了分布在6,671个基因的26,953突变热点簇,发现了65,488个潜在可成药突变位点。发布了HotSpot3D突变热点分析在线计算服务器及突变临近对数据库,支撑了20多个国家的3000多个在线分析,HotSpot3D在项目资助期间持续进行性能优化,获得120余次论文引用,并被应用于ICGC的PCAWG全基因组数据分析项目中,合作发表了6篇Nature(2020,参与作者),18篇Nature子刊(2020,参与作者)。此外,与时俱进,后端蛋白质结构数据库及时整合了AlphaFold2预测的蛋白质结构数据。受本项目资助,共发表标注SCI论文7篇(Briefings in Bioinformatics, Bioinformatics, Genomics Proteomics & Bioinformatics等,项目负责人皆为通讯作者)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
4

地震作用下岩羊村滑坡稳定性与失稳机制研究

地震作用下岩羊村滑坡稳定性与失稳机制研究

DOI:10.16285/j.rsm.2019.1374
发表时间:2020
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

牛北方的其他基金

相似国自然基金

1

泛癌体细胞突变在miRNA及其靶基因调控网络中的扰动和作用研究

批准号:31801084
批准年份:2018
负责人:华旭
学科分类:C0602
资助金额:26.00
项目类别:青年科学基金项目
2

刚性泛函微分方程数值分析及高效算法

批准号:10871164
批准年份:2008
负责人:李寿佛
学科分类:A0504
资助金额:28.00
项目类别:面上项目
3

基于新一代测序数据的泛癌miRNA调控模块发现算法研究

批准号:61602283
批准年份:2016
负责人:梁成
学科分类:F0213
资助金额:20.00
项目类别:青年科学基金项目
4

泛函网络代数理论与学习算法及泛化能力研究

批准号:61165015
批准年份:2011
负责人:周永权
学科分类:F0601
资助金额:47.00
项目类别:地区科学基金项目