Protein design is a new route to deepening our understanding of rules governing protein sequence-structure relations. It also provides tools for protein engineering based on rational design. The task of protein design can be decomposed into two levels, including the design of amino acid sequences for a given target backbone structure or backbone fold, and the design of backbone folds that are associated with high designablility. The designability of a backbone fold refers to that amino acid sequences that stably fold into this backbone structure actually exist. To experimentally verify the designability of a backbone fold relies on amino acid sequence design methods that have high success rate. We have developed and experimentally verified a method for sequence design. In current project, based on further improvement of this method, we will develop simulation techniques including chain growth and multi-scale modeling methods that can design backbone folds. We will also develop scoring functions for designability based on known protein structure data and the Bayesian theory. Finally, amino acid sequences will be designed for artificially constructed backbone folds. Such designed proteins will be experimentally verified to fold into respective designed backbone structures.
人工设计蛋白质是深入认识蛋白质序列结构规律的新途径,也能为基于合理设计的蛋白质工程提供工具。蛋白质设计可分为两个层次:以给定主链折叠为目标设计氨基酸序列和从头设计有高”可设计性“的主链折叠。这里“可设计性”是指能够稳定折叠成给定主链结构的氨基酸序列确实存在。对主链折叠“可设计性”的实验验证依赖于高成功率的氨基酸序列设计方法。我们在前期研究中建立了氨基酸序列设计方法,并进行了实验验证。本项目将在对全自动序列设计进一步完善的基础上,采用链生长抽样、多尺度模型等技术,发展能设计蛋白质主链折叠的模拟技术;以天然蛋白质结构数据为依据,基于贝叶斯理论建立”可设计性“的评价函数。最后,以人工构建的主链折叠为目标结构进行氨基酸序列设计,获得主链折叠和氨基酸序列均为人工设计的新蛋白。
人工设计蛋白质是深入认识蛋白质序列结构规律的新途径,也能为基于合理设计的蛋白质 工程提供工具。蛋白质设计可分为两个层次:以给定主链折叠为目标设计氨基酸序列、从头设计有高”可设计性“的主链折叠。我们在前期研究中建立了ABACUS氨基酸序列设计方法,并进行了实验验证。本项目提出的研究目标如下:(a)完善氨基酸序列设计方法,为给定主链折叠全自动设计序列;(b)建立计算方法构建“高可设计性”主链折叠,进行理论评价; (c)获得主链折叠和氨基酸序列均为人工设计(必要时通过定向进化 改进)的蛋白,争取获得“新”折叠类型(novel fold)的人工蛋白。项目全面完成了研究目标(a),(b), 在(c)上亦取得重要进展,具体包括:(a)改进ABACUS氨基酸序列设计方法。据到目前为止的文献报道,ABACUS是国际上两个经实验反复验证能为给定主链全自动从头设计氨基酸序列的方法之一(另一方法是华盛顿大学研发的RosettaDesign)。此外,ABACUS采用了独特的统计能量模型,生成的设计结果显著不同于其他设计算法。改进后的ABACUS2算法效率更高,用户可通过服务网页在线完成序列设计。(b) 建立了SCUBA主链从头设计方法。 已有的蛋白质主链结构从头设计工作主要利用二级结构或超二级结构单元之间理想堆积构象的参数化模型,并用取自天然机构的主链片段拼接来构建主链。据我们所知,SCUBA是首个能不利用天然肽段拼接而是实通过对主链全原子自由度的全柔性搜索、优化来进行主链设计的模型。在更一般的计算方法层面,SCUBA是用我们首先提出的NC-NN算法来构建的,NC-NN是一种全新的构建高维、连续可微统计能量函数的通用方法,预期其在结构生物信息学领域会有广泛应用。(c) 我们已经完成了一项实验验证实例,用SCUBA设计主链以及ABACUS设计序列得到的人工蛋白晶体结构与设计结果相符。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
农超对接模式中利益分配问题研究
蛋白质局部序列构象关系及其在蛋白质力场优化和序列设计中的应用
蛋白质序列分析、结构预测和折叠动力学及其相关问题
蛋白质配基识别位点序列的计算设计
人工设计蛋白质的可折叠性的高效实验检测与优化