Protein structural prediction is very important for complementing the experimental structural biology. Recently, it is attractive to predict protein structures from evolutionary sequence variations. However, there are two limitations by this method: firstly, there are not enough homologous sequences of many proteins; secondly, the harmful structural informations are not included because homologous sequences are the successful results of natural selection. .In this project, a huge number of “homologous” sequences will be obtained by screening experiments in yeast and high throughput sequencing. Amino acid covariations will be extracted from these sequences and used to fold the protein. We try to benchmark the approach that predicting the structure of proteins by experimental evolution, high throughput sequencing and covariation analysis. The approach is more convenient, more accurate and easier to be promoted.
蛋白结构预测方法具有十分重要的意义。近年来通过同源序列中共进化的残基信息预测蛋白分子三维结构的方法越来越受到人们的重视。然而,自然界中许多蛋白的同源序列数目较少;更为关键的是,对蛋白功能有害的突变被自然选择所淘汰,导致对蛋白折叠有负面影响的结构信息不能在现存蛋白序列中体现。此两点大大限制了该方法的应用。.据此,本项目拟建立基于“实验演化-关联变异”的蛋白结构预测方法,利用酵母筛选系统,结合高通量测序技术,快速得到大量的“同源”序列,根据共进化原理提取出接触残基对和不可接触残基对信息,预测蛋白结构。相较于现有共进化预测蛋白结构的方法,该方法能够轻易获得大量的“同源”序列,以及包含有害突变的“同源”序列,使得基于共进化的结构预测更为准确,从而能够十分有效地推广到其它蛋白的结构预测。
本项目按照计划,对基于 “实验演化-关联变异”预测蛋白三维结构的方法进行了研究。我们发现,实验演化产生的蛋白突变序列与真实的同源、同家族序列有显著的不同,预测出来的残基接触位点准确性较差。实验演化能够克服很多蛋白分子同源序列不足的先天劣势,因此有着非常重要的研究意义。我们将利用蛋白同源序列的特征,设计合成oligo突变序列库,增加突变体筛选条件及次数,改进测序方法,继续对这一问题进行研究。利用该研究获得的知识及研究经验,我们对一种DNA脱氨酶AID的结构进行了分析,然后利用酵母筛选系统,对AID进行了优化,定向进化出能够使突变率从10^-9–10^-10提高到10^-3–10^-4(靶标序列)的高活性AID版本,进而开发了一套基于barcode的细胞示踪工具。除此之外,我们采用单细胞高通量测序的方法,首次在小鼠体内追踪了胚胎的X染色体失活过程。我们发现,即使处于相同发育阶段,不同细胞的失活进程也是不一样的,这一点与体外胚胎干细胞诱导的同步化过程不同,体现出了异质性,该研究成果发表在BMC Genomics上。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
基于LASSO-SVMR模型城市生活需水量的预测
基于多模态信息特征融合的犯罪预测算法研究
基于分形维数和支持向量机的串联电弧故障诊断方法
陶瓷热冲击裂纹演化与其残余强度内在关联的实验研究
基于链路预测和零模型的演化网络结构分析
基于信息融合的跨膜蛋白拓扑结构预测
基于蛋白结构的成药性预测新方法研究