基于多源信息融合的蛋白质结构域折叠模式预测模型研究

基本信息
批准号:61602100
项目类别:青年科学基金项目
资助金额:20.00
负责人:张丽超
学科分类:
依托单位:东北大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:孔亮,李峰,王海娜
关键词:
生物信息学分子生物学生物信息分析
结项摘要

It is one of the great challenges to describe the structure and biology function of protein in post-genome era. Prediction of domain folding pattern of proteins is essential and important to their structure and biology function analysis. According to different granularities, prediction of protein domain folding pattern contains two sub-problems: prediction of protein structural class and prediction of protein fold. Based on the modern theories and methods of statistical pattern recognition, feature representation from multi-source information and information fusion classifier system will be studied in a following simple-to-complex way in this project. Firstly, the key factors which reflect the characters of protein folding structure will be analyzed, and data description and feature representation of proteins from multi-source information will be designed. Secondly, to construct coarse-grained protein structural class prediction model, a multiple kernel learning system framework will be proposed to fuse the complementary information of patterns hidden in multi-feature. Finally, on the basis of hierarchical inclusion relationship between the concepts of protein structural class and protein fold, a fusion mechanism will be designed from the aspects of feature representation and classifier design to fuse structural class annotation. Moreover, the fusion mechanism will be embedded into a hierarchical protein fold prediction model to perform high-quality prediction of domain folding pattern in the fine-grained level. The results of this project will promote the research on protein structure and biology function. In addition, it is also of great benefit to extend the application of theories and methods of pattern recognition in bioinformatics community.

描述蛋白质结构及其生物学功能是后基因组时代的重大挑战之一。预测蛋白质结构域折叠模式是蛋白质结构和功能分析中的重要一环。根据折叠模式的不同粒度,蛋白质结构域折叠模式预测涵盖结构类预测和折叠子预测两个子问题。本申请项目基于现代统计模式识别理论与方法,从多源信息特征表示和信息融合分类器系统设计等方面展开由简到繁的递进式研究。首先,分析反映蛋白质折叠结构特点的关键因素,设计多源信息下蛋白质的数据描述和特征表示方法;其次,提出多核学习框架融合多源特征的互补模式信息,构建粗粒度层蛋白质结构类预测模型;最后,基于结构类和折叠子两概念间的层次性包含关系,从特征表示和分类器设计两个方面设计结构类注释信息融合机制,并将其嵌入到层次化折叠子预测模型中,最终实现细粒度层折叠模式的高效预测。本项目的研究成果将促进蛋白质结构和功能的研究,同时也有助于拓展模式识别理论与方法在生物信息学领域的应用研究。

项目摘要

描述蛋白质结构及其生物学功能是后基因组时代的重大挑战之一。预测蛋白质结构域折叠模式是蛋白质结构和功能分析中的重要一环。整个项目的研究围绕着蛋白质结构域折叠模式预测相关理论与关键技术,按照计划书任务,分层次分步骤进行。首先分析反映蛋白质折叠结构特点的关键因素,设计多源信息下蛋白质的数据描述和特征表示方法;在此基础上,设计多分类器系统融合多源特征的互补模式信息,构建粗粒度层蛋白质结构类预测模型;针对获取的蛋白质结构类注释信息,设计融合机制,将其嵌入到多分类器系统框架中,并最终构建出该框架下的细粒度层蛋白质折叠子预测模型。本项目的研究结果主要体现在:(1)提出了一种基于蛋白质二级结构图形表示的特征表示方法。使用推广的混沌游走表示方法图形化蛋白质二级结构序列,将二级结构元素间的一维线性距离扩展二维平面距离,在此基础上构造若干描述二级结构距离分布的统计量作为蛋白质特征。该类特征对于提高较难区分的α/β类和α+β类蛋白质有显著效果。(2)提出了一种基于蛋白质序列进化信息的特征表示方法。从蛋白质氨基酸序列出发,整合位置特异性打分矩阵蕴含的蛋白质序列进化保守性信息,提出3种序列进化相关函数,多方面描述蛋白质序列氨基酸之间整体和局部的排列顺序信息。(3)提出了基于“软分类”的层次化蛋白质折叠模式预测框架。该层次化预测框架可以有效降低粗粒度层蛋白质结构类的错误分类对最终折叠子的分类带来的负面影响。综合上述结果,本项目的研究不仅丰富蛋白质结构域折叠模式预测等生物信息学研究领域的理论和方法,对后续蛋白质结构、功能和生物技术的发展也具有重要的指导意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

张丽超的其他基金

相似国自然基金

1

基于多源信息融合的蛋白质功能预测方法研究

批准号:61903106
批准年份:2019
负责人:李满枝
学科分类:F0305
资助金额:25.00
项目类别:青年科学基金项目
2

基于多源信息融合的蛋白质相互作用预测研究

批准号:60775012
批准年份:2007
负责人:张绍武
学科分类:F0605
资助金额:28.00
项目类别:面上项目
3

基于多源信息融合的蛋白质亚细胞定位预测算法研究

批准号:61272312
批准年份:2012
负责人:姚玉华
学科分类:F0214
资助金额:80.00
项目类别:面上项目
4

基于多源信息融合的受体和抗菌肽分层多标签分类预测模型研究

批准号:31260273
批准年份:2012
负责人:肖绚
学科分类:C0608
资助金额:50.00
项目类别:地区科学基金项目