Human Leukocyte Antigen (HLA) is the human MHC. The main function of MHC molecules is to display antigenic peptides to the surface of cell where they will be recognized by T cells. Identification of antigenic peptides plays a vital role in developing epitope vaccines, thus a number of experimental and computational approaches have been developed for their identification. The HLA is highly polymorphic which limits the design of high population coverage epitope vaccines.Each HLA molecule only binds to specific peptides, but it has been observed that different HLA molecules have overlapping peptide binding sets and there have been several attempts to group them into supertypes accordingly.In view of this, we will lay our focus on developing novel high performance methods for MHC significant residues identification and supertype classification. Specifically, the newly proposed methods will be based on the analysis of MHC-peptide binding specificity and the theory of metric MDS analysis and Lasso feature selection. In this project, we will attempt to apply metric MDS appropriately in the construction of MHC-peptide binding map and then integrate it with Lasso algorithm for MHC significant residues identification. The anticipated output of this project will benefit MHC significant residues identification and supertype classification both in theory and in application.
人类白细胞抗原(HLA)是人类的MHC。主要功能是将多肽递呈到细胞表面以供T细胞识别。识别抗原肽对开发表位疫苗起到重要的作用,很多研究提出了基于生物和计算机手段识别抗原肽的方法,然而HLA基因的高度多态性限制了高人口覆盖率表位疫苗的设计。虽然每个HLA分子只能与特定的多肽集群结合,但观察发现不同HLA可以结合的多肽集群是重合的,因此MHC超类型提出的目的在于将MHC分子进行归类,从而应对繁复的HLA的多态性。鉴于此,在本项目中我们将致力于提出高性能的算法用于鉴定MHC多肽结合位点和识别MHC超类型。拟提出的新方法将建立在对MHC多肽结合性质、计量多维尺度分析及Lasso特征提取的基础上。我们将尝试把计量多维尺度分析应用于构建MHC抗原肽结合图谱,同时结合Lasso提取出抗原肽MHC结合的关键性位点。本项目的预期成果将在理论和应用两方面促进MHC抗原肽结合位点鉴定和MHC超类型识别的发展。
人类白细胞抗原(HLA)是人类的MHC。主要功能是将多肽递呈到细胞表面以供T细胞识别。识别抗原多肽对开发表位疫苗起到至关重要的作用,因此研究者们提出了很多基于生物和计算机手段识别抗原多肽的方法,然而HLA基因的高度多态性限制了高人口覆盖率的表位疫苗的设计。虽然每个HLA分子都只能与特定的多肽集群结合,但观察发现不同HLA分子可以结合的多肽集群是重合的,因此MHC超类型提出的目的在于将MHC分子进行归类,从而应对繁复的HLA的多态性。另外,MHC基因的高度多态性对设计算法用于准确预测那些很少已知结合肽的MHC II类分子也是一个很大挑战。.本项目旨在提出高性能的算法用于识别MHC II超类型和预测MHC II结合肽。基于大规模的MHC II抗原的定量亲和力值,我们提出了一个能够有效量化MHC II类分子与多肽结合特异性的差异性度量指标。同时结合层次聚类算法识别MHC II超类型。我们提出一个新的基于MHC II超类型来预测MHC II结合肽的算法,简称superMHC。该模型能够预测包含HLA-DR, HLA-DQ和HLA-DP分子的结合肽,并且取得了与目前此领域里准确性最高的算法一致的预测结果。superMHC算法对于那些没有或很少实验室测量值的MHC分子一样可以给出很高的预测精度。.除此之外我们还尝试了基于核函数的RLS回归算法在RNA与蛋白质相互作用的应用:我们开发了一个新的预测RNA与蛋白质相互作用的方法,该方法在预测lncRNA与蛋白互作数据集上达到了92%的准确率。我们还系统研究了几种新发现的lncRNA在食管鳞癌中的作用机制,以及探讨它们在食管鳞癌发生、发展、转移中起到的作用和临床应用前景。.本项目研究成果推动了MHC超类型识别和MHC结合肽预测领域的发展,也拓展了机器学习理论工具在该领域的应用,具有较好的科学理论价值和工程应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
农超对接模式中利益分配问题研究
内点最大化与冗余点控制的小型无人机遥感图像配准
氯盐环境下钢筋混凝土梁的黏结试验研究
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
有约束多项分布转录因子结合位点识别
转录因子TDF1结合位点分析及直接调控下游基因鉴定
脂多糖结合蛋白功能位点分析及其抑制性多肽的筛选
猪瘟病毒囊膜糖蛋白靶细胞结合位点的鉴定