基于蛋白质结构域家族一致模板的蛋白质穿线算法及其并行化研究

基本信息
批准号:61070129
项目类别:面上项目
资助金额:30.00
负责人:李玉岗
学科分类:
依托单位:北京理工大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:苑波,董岩,周修庄,李善青,朱凤龙,尚婷婷,林源,赵坤
关键词:
模板并行化蛋白质三维结构预测片段条件随机场模型机器学习
结项摘要

蛋白质穿线算法可以在序列相似度较低的情况下准确地预测目标蛋白质的结构,是应用范围最广的预测工具之一。但是,传统的穿线算法具有如下缺陷:采用的模板或者强调蛋白质个体特征,或者没有充分体现结构方面的特征;选择模板和预测结果的算法都没有充分利用结构特征。此外,如何更好地预测多结构域蛋白质的结构也是一个重要的问题。.针对这些问题,本项目拟从以下方面研究基于结构域家族一致模板的穿线算法:1)研究.如何提取结构域家族一致形状作为模板,构建模板库;2)研究3维片断条件随机场谱模型,用来更准确地选择模板;3)研究如何利用蛋白质结构信息,设计高效、准确的选择算法;4)针对多结构域蛋白质,研究如何准确地预测各个结构域的结构,进而构造出整体结构;5)对上述算法进行面向多核体系结构的并行化研究,进一步提高算法性能。本课题的研究,将进一步拓宽蛋白质穿线算法的应用范围,促进蛋白质组学的发展。

项目摘要

对目前常用的蛋白质数据库进行分析,从中提取合适的数据构建源数据库。由PDB,SCOP和Pfam三种数据库构造了一个非冗余的蛋白质结构分类数据集,在此基础上研究蛋白质的分类及预测方法。对常用的几种概率图模型HMM,MEMM、CRF和SCRF进行研究,分析了各自的优点和存在的不足。首先利用CRF进行二级结构预测:利用构建的非冗余蛋白质结构分类数据集,通过结构信息对二级结构进行标注,进而构造基于CRF的模型,用于二级结构的预测,得到了良好的效果。3)提取已知结构蛋白质中非结构域部分的结构特征,用于蛋白质结构预测,这一部分内容尚待进一步研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

李玉岗的其他基金

相似国自然基金

1

蛋白质空间结构的同源建模及其并行化研究

批准号:60503060
批准年份:2005
负责人:张法
学科分类:F0210
资助金额:25.00
项目类别:青年科学基金项目
2

基于蛋白质结构域插入事件的结构域架构进化研究

批准号:30571037
批准年份:2005
负责人:林魁
学科分类:C0607
资助金额:28.00
项目类别:面上项目
3

识别蛋白质超家族之间远程同源性的算法研究

批准号:11201334
批准年份:2012
负责人:陈科
学科分类:A0604
资助金额:22.00
项目类别:青年科学基金项目
4

分离的蛋白质结构域和构成蛋白质分子的组件的研究

批准号:39230100
批准年份:1992
负责人:许根俊
学科分类:C0505
资助金额:50.00
项目类别:重点项目