后基因组时代最有意义和最具挑战性的工作之一是蛋白质的结构和功能注释,然而用实验手段解决这些问题不但耗资、耗时,而且还存在着无法解决的技术上的困难。因此在理论上研究并预测蛋白质的结构和功能是生物信息学的重要研究课题。目前,直接从序列信息预测蛋白质的结构还很困难,蛋白质超二级结构及其特殊模体的信息研究和预测是三级结构预测的桥梁,对蛋白质的折叠、识别、稳定性起重要作用,还能为新药设计提供分子模板信息。本项目以已知结构的蛋白质数据库为基础,从蛋白质序列出发,利用物理学、生物信息学、信息学等理论方法和计算机技术相结合,在理论上研究蛋白质超二级结构及其特殊模体。主要研究超二级结构及其特殊模体的序列特征在统计意义上的规律;发展超二级结构及其特殊模体预测的新方法;探索功能位点的氨基酸构成;研制超二级结构及其特殊模体预测的软件原型系统。
蛋白质超二级结构及其特殊模体的信息研究和预测是三级结构预测的桥梁,对蛋白质的折叠、识别、稳定性起重要作用,还能为新药设计提供分子模板信息。本项目以已知结构的蛋白质数据库(PDB、SCOP、DSSP、LPC及ArchDB等)为基础,从蛋白质序列出发,利用物理学、生物信息学、信息学等理论方法和计算机技术相结合,在理论上研究了蛋白质超二级结构及其特殊模体。主要研究了四种简单超二级结构及其特殊模体β-发夹和β-α-β模体的序列特征在统计意义上的规律;发展了超二级结构及其特殊模体预测的新方法,如随机森林、支持向量机和二次判别算法等;初步探索了功能位点的氨基酸构成及序列统计规律,并给予初步预测;研制了超二级结构及其特殊模体预测的软件原型系统。研究结果有:建立了研究所需的新的超二级结构数据库1个、特殊模体β-发夹数据库2个、β-α-β模体数据库3个、酶β-发夹功能位点数据库1个及硫酸根离子结合位点数据库1个;对每一部分的研究都有统计分析过程,通过统计分析结合生物背景知识找到了预测的最佳特征;经过大量的计算和技术处理摸索出了一些合理的计算算法,得到了目前最好的预测结果,达到国际前沿水平。这些结果为蛋白质结构和功能研究奠定了坚实基础,为实验工作者提供理论指导。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
农超对接模式中利益分配问题研究
基于LASSO-SVMR模型城市生活需水量的预测
基于多模态信息特征融合的犯罪预测算法研究
面向云工作流安全的任务调度方法
蛋白质超二级结构特征表达及分类算法研究
限制特殊奇Hamilton超代数的Kac模
蛋白质超二级结构模型和预测及其在生物工程中的应用
蛋白质二级结构片段结构和软X射线谱学表征的理论研究