Conformational space optimization is the critical part of de novo protein structure prediction. Aiming at the high dimensionality of protein conformational space, the feature vector underestimation model is built based on the dimensionality reduction method, which inspired by the idea of "piecewise linear supporting hyperplane" that provided by abstract convex theory. By using the constructed model, the original high-dimensional dihedral angle space can be projected to the feature vector estimated space with much lower dimension, which can effectively avoid the dimension disaster problem. With analyzing the geometric properties of the estimated model, the relationships between Voronoi diagram and extreme points on the estimated surface can be discovered, and contributes to the design of fast enumeration algorithm of estimated model. Based on the Protein Database Bank (PDB), multiple-feature gapless threading alignment method is designed to build the position-specific fragment libraries, and statistical consistency analysis method is used to extract the a priori knowledge of protein structures. In accordance with the space complementary nature of the estimated model, the multimodal evolutionary optimization algorithms can be proposed. Main idea of the proposed algorithms is to safely exclude the trap region by building and further solving a sequence of piecewise linear relaxed problems. Furthermore, a biased niche indicator and a feature vector similarity indicator are constructed for realizing the sampling process of adaptive exploration and exploitation. Eventually, the de novo protein structure prediction software will be developed, and further, online server will be provided. As the research of the project continues, the protein folding mechanisms is hope to be revealed and the function of proteins can be annotated, which can provide a theoretical foundation for the design and development of novel protein and gene medicines.
构象空间优化是蛋白质结构从头预测的关键环节。针对构象空间高维特性,借鉴抽象凸分段线性支撑思想,基于维数约简方法建立蛋白质结构特征向量估计模型,将高维二面角优化空间映射至低维结构特征向量估计空间,有效避免维数灾问题;通过分析估计模型几何特性,揭示Voronoi图与估计曲面极值点之间的映射关系,设计估计模型快速枚举算法;基于PDB数据库,设计多特征无缝穿线比对方法构建序列位置特定结构片段库,采用统计一致性分析方法提取结构先验知识;基于估计模型空间互补分割特性,设计构象空间区域剖分多模态优化算法,通过构建渐进收紧下界,系统可靠排除无效构象空间区域;进而,建立有偏采样小生境指标及特征向量相似度指标,动态实现自适应模态探测和模态内增强过程;最终,设计开发蛋白质结构从头预测服务平台。项目将有助于揭示蛋白质折叠规律,通过对蛋白质结构的预测,进行蛋白功能注释,为新型蛋白和基因药物的设计和研发提供理论依据。
蛋白质结构预测是计算生物学中一个尚未解决的重大基础性问题,而构象空间优化又是蛋白质结构预测的关键环节。蛋白质构象空间固有的高维特性、多尺度性、不精确性是当前构象空间优化方法面临的一个挑战性问题。项目组针对构象空间高维特性,进行了构象空间特征向量简约模型研究,特征向量简约估计模型与快速求解算法研究,高精度片段构建策略及结构先验知识挖掘,蛋白质构象空间多模态优化算法研究,以及蛋白质结构从头预测服务平台开发。本项目执行期间,项目组开发了多域蛋白质结构组装服务器DEMO、SADA,多域蛋白质结构数据库MPDB,模型质量评估服务器DeepUMQA,以及蛋白质结构预测服务器RocketX,实现了较大规模蛋白质的高精度、高通量结构预测。DEMO是全球第一个真正意义上的全自动多域蛋白质结构组装服务器。DeepUMQA和RocketX参加了全球持续蛋白质结构预测竞赛CAMEO,DeepUMQA在模型质量评估组别“all dataset”周测中世界排名第一(2022年1月1日),RocketX在三维结构预测组别“Hard”类测试集上月测排名世界第五(2022年1月1日)。项目负责人以通信作者或第一作者在《美国科学院院刊》、《Bioinformatics》以及IEEE汇刊TEVC、TCYB、TCBB等期刊发表本基金标注论文23篇,授权发明专利20项,参与编写《生物信息学》规划教材1部。项目负责人指导研究生获得中国国际“互联网+”创新创业大赛银奖、全国“挑战杯”大学生课外学术作品竞赛国家级二等奖;指导1名博士生获得浙江省优秀博士学位论文、1名硕士生获得浙江省优秀硕士学位论文。项目研究成果将有助于缩短目前基因组序列数量和实验测定结构数量之间的鸿沟,满足结构生物社区对多域蛋白质结构预测日益增长的需求;将有助于研究蛋白质动态结构、折叠路径等未解决科学问题。本项目的实施,在生物学意义上,可以揭示蛋白质分子折叠规律,通过对蛋白质结构的预测,进行蛋白质功能注释,为新型材料和基因药物的设计和研发提供理论依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
1例脊肌萎缩症伴脊柱侧凸患儿后路脊柱矫形术的麻醉护理配合
基于LASSO-SVMR模型城市生活需水量的预测
基于多模态信息特征融合的犯罪预测算法研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
面向多模态脑机接口的高维脑信号处理方法研究
基于多属性空间分割的高维代理模型全局优化方法研究
多尺度模拟集成小角散射数据研究蛋白质构象变化的方法
基于空间构象的岩藻聚糖硫酸酯-蛋白质静电自组装机制及复合物消化行为研究