Influenza A viruses are among important pathogens that threatens human health. The epidemics of influenza is mostly determined by Hemagglutinin (HA), one of its surface proteins. Thus, the study of this protein is critical in understanding the molecular basis of flu outbreaks and the development of influenza vaccines. In this project, we will establish a model to visualize the HA of influenza viruses; construct a high-dimensional feature vector to represent this protein; extract conservative information, complexity information, component information and global information to help study the critical information of influenza A virus before and after mutation; compare the similarity between viral HA sequences by covariance matrix and correlation coefficient; develop classification and evolutionary algorithms by fuzzy theory; explore the topological characteristics of low pathogenic and high pathogenic influenza virus evolution map; design optimization algorithm to select core information; jointly consider sequence and structure features, evolution information and other multi-source information to construct antigenic epitope prediction models using machine learning methods. By manifesting the correlation between biological characteristics and influenza pathogenicity at molecular level, one can better predict the epidemics of influenza viruses and understand the drug resistance patterns. This study is not only helpful in guiding vaccine development, but also provides important basis for effective measures to control flus.
甲型流感病毒长期以来一直是威胁人类健康的重要病原体之一,其血凝素(hemagglutininj, HA)蛋白与流感的发生和流行关系最为密切,是流感病毒发生抗原变异的分子基础,也是研发流感疫苗的关键抗原。本项目基于迭代函数系统创建HA蛋白的可视化模型,构造高维特征/模式向量;系统的提取蛋白质的保守信息、复杂度信息、组分信息、全局信息,研究甲型流感病毒发生重要变异前后的关键性提示信息;通过协方差矩阵和相关系数比较病毒序列之间的相似性,利用模糊理论分别给出分类算法和进化算法,探索低致病力和高致病力流感病毒进化图谱的拓扑特征;设计优化算法挑选核心信息,联合序列结构特征和进化等多源信息,采用机器学习方法构建高效的抗原表位预测模型。从分子水平研究流感病毒的生物学特性及其与致病性的关系,可以更好的揭示流感病毒的流行趋势、抗药性,不仅对设计新的疫苗具有前瞻指导作用,也能够为制定有效的防治措施提供重要依据。
及时的鉴定新出现流感病毒的抗原性变异对于流感疫苗的设计,流感的监督以及人们的生命健康都是至关重要的。传统的实验方法虽然预测效果不错,但却有不少缺点和不足:费时又费力,不能及时有效的对流感起到监控作用;有些实验无法顺利进行而导致我们获取的血清学数据比较稀疏(含有大量的缺失值);测量值存在人为和系统误差故而最终的血清学数据存中有不少值过低。为了加速对流感病毒抗原性变异的预测速度及提升预测质量,基于流感病毒血凝素蛋白序列的生物信息学方法不断的被提出。本项目通过提取血凝素蛋白的序列信息并结合对应血清学数据对甲型流感病毒的抗原性变异进行分析和预测:(1)基于迭代函数系统创建HA蛋白的可视化模型,构造高维特征向量,系统的提取蛋白质的保守信息、复杂度信息、组分信息、全局信息,研究甲型流感病毒发生重要变异前后的关键性提示信息;(2)提出了一种基于血凝素蛋白序列的矩阵填充算法,用于填充和矫正原本过于稀疏的及含有不少不稳定值的血凝素抑制试验测试数据,从而得以更精确的计算各病毒间的抗原性距离,并通过多维尺度分析算法将其抗原性距离映射到二维空间,从而得到甲型流感病毒抗原性距离可视化的效果。我们的预测精度比之前的研究提升了37%;(3)通过协方差矩阵和相关系数比较病毒序列之间的相似性,利用模糊理论分别给出分类算法和进化算法,探索低致病力和高致病力流感病毒进化图谱的拓扑特征;(4)提出了一种基于血凝素蛋白序列的联合随机森林算法,用于直接预测甲型流感病毒的抗原性距离。我们结合94种氨基酸替换矩阵及HA1对甲型流感病毒的抗原性距离进行预测。我们的算法不仅提升了预测精度,而且对新的病毒序列的抗原性变异有很好的预测效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
H1N1流感病毒血凝素异嗜性抗原表位分析及突变研究
用B细胞表位分析技术研究甲型流感NA抗原变异
甲型流感病毒抗原进化及变异规律研究
重组多表位流感病毒模拟表位抗原疫苗的实验研究