Tumor neoantigens are the altered proteins caused by tumor somatic mutations in genome. Neoantigens can induce specific cellular immunity, may also enhance the efficacy of anti-checkpoint therapy, thus representing important targets for personalized immunotherapy. The large amount of tumor genomic mutation data generated by new generation sequencing (NGS) technology provides a great space for the selection of tumor antigens. Currently tumor neoantigens are mostly predicted by whole-exome sequencing data, some with mRNA sequencing data to verify the transcriptomic expressions. However, the large number of candidates, the high false positivity, and the lengthy experimental validation process are bottlenecks for the clinical application of neoantigens. This project will utilize proteogenomics strategy to provide protein level expression evidence based on constructed human immunopeptidomics HLA-I binding peptide database, by database match scoring, or by mass spectrometry proteome data analysis; will establish mouse models bearing neoantigen-expressing tumor cells to experimentally validate the immunogenicity of predicted neoepitope peptides; will investigate the immunogenicity mechanism of the neoantigens based on the sequence and structural characteristics of the detected neoepitopes, to further help improve neoantigen prediction algorithms. The established bioinformatics resources through this project would take advantage of proteomics data to enhance the tumor antigen prediction efficiency and accuracy based on NGS data, thus promoting clinical application of neoantigen-based immunotherapies.
肿瘤新抗原是由肿瘤组织中体细胞突变引起的蛋白质改变产生。新抗原能诱导特异抗肿瘤细胞免疫,能促进免疫检查点抗体治疗的免疫应答,是个性化免疫治疗的重要靶点。新一代测序技术产生的大量个体肿瘤基因组突变数据给肿瘤特异性新抗原筛选提供了极大空间。目前肿瘤新抗原多是从基因组外显子测序数据及转录组数据预测。但候选序列过多、假阳性过高、实验验证耗时过长是限制肿瘤新抗原临床应用的瓶颈。本项目采用蛋白质基因组学研究手段,利用最先进的免疫肽段组学数据,建立人HLA-I结合肽段数据库,通过匹配打分、质谱鉴定提供肿瘤新抗原的肽段证据;通过小鼠荷瘤体系验证新抗原肽的免疫原性;对高可信度肿瘤新抗原肽段分析其特征,探讨免疫原性机制,优化预测算法。本研究的成果最终可建立成生物信息学平台,将充分利用蛋白质组学数据的独有优势,促进基于基因组测序数据的肿瘤新抗原预测和验证的成效性,推动肿瘤免疫治疗的临床应用。
肿瘤新抗原肽能被T细胞受体(TCR)识别而激发重要的抗肿瘤细胞免疫,是肿瘤疫苗设计的新来源。由于肿瘤新抗原源于基因组突变,发挥功能于蛋白质肽,因此成为连接肿瘤基因组和蛋白质组学的国际研究热点及难点领域。本项目原设定目标概括为:建立肿瘤新抗原的蛋白质基因组学预测流程;提供验证数据库;建立免疫原性预测算法;提供综合生物信息学平台。通过四年的研究,申请团队已经完成该项目所有预设目标,并为下一阶段研究准备了拓展方向。具体成果包括:利用肿瘤样本的质谱数据,国内首次搭建了整合基因组、转录组、蛋白质组数据的新抗原预测流程ProGeo-neo,并将其升级到2.0版本。为了对预测结果进行筛选验证,基于免疫实验识别验证的免疫肽段数据构建了第一个人源HLA-I验证肿瘤新抗原肽数据库dbPepNeo,并将数据量及数据类型升级至2.0版本。基于收集数据中氨基酸序列的理化性质、编码信息、信息熵、及HLA结合的%rank值等特征构建了免疫原性计算方法,可用来预测新抗原肽的T细胞识别性。所产出的分析流程、数据库、自有算法,都整合在dbPepNeo2.0,提供了一个肿瘤新抗原预测和验证的综合生物信息学平台。在此基础上,构建了一个肿瘤新抗原肽免疫应答质量打分(NAIRscore),应用于多发性骨髓瘤患者的新抗原分析;建立了一个广谱适用于病毒、肿瘤蛋白质等的多肽疫苗候选表位预测和筛选的工作流;针对抗原识别端T细胞提前布局,对当前TCR组库研究及其在肿瘤免疫中的应用前景发表了综述;并开发了可从COVID-19患者的TCR免疫组库中筛选TCR CDR3及其识别的SARS-CoV-2表位的分类器。本项目建立的肿瘤新抗原肽鉴定、优选和应用的策略方案,为下一阶段的肽疫苗机制研究和免疫治疗应用打下了良好基础。相关学术成果包括:发表了10篇研究论文,2篇研究综述;获得2项软件著作权;培养了9名研究生及博士后人才。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
FBL-3肿瘤抗原的预测及验证
利用质谱为基础的蛋白基因组学方法发现和分析肿瘤特异性新抗原
新的肿瘤抗原-线粒体蛋白12的功能和应用研究
蛋白质新折叠模式预测