基于多源信息融合的受体和抗菌肽分层多标签分类预测模型研究

基本信息
批准号:31260273
项目类别:地区科学基金项目
资助金额:50.00
负责人:肖绚
学科分类:
依托单位:景德镇陶瓷大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:吴志诚,贾建华,程翔,王普,刘陶,陈致敏,闵建亮
关键词:
多标签分类器信息融合基因本体生物序列元胞自动机图
结项摘要

Studying the structure, function and localization information of acceptor and the antibacterial peptide has become the focus of current biological and pharmacological, but there are many problems to determine these information through biological experimental methods, such as high cost, long cycle, and even some current technology can not be achieved. However, with the development of network and information technology, it is possible to make access to different scales and different levels of multi-source biological information. The project coordinate the utilization of the protein cellular automaton image(reflecting the interaction of the different positions of amino acids), physical and chemical properties of the matrix(reflecting the relationship of physical and chemical properties between amino acids), PSSM matrix(reflecting the amino acid sequence phylogenetic information), GO(Gene Ontology) and functional domain information can get more accurate and more robust performance, compared with only a single source of information. And protein discrete gray model, fuzzy K-nearest neighbor, support vector machine and other pattern recognition algorithms to provide complementary information to further improve the accuracy of the integration of decision-making. The project will also design an efficient multi-label classifier to integrate with existing ML-KNN, neural network algorithms to achieve ultimately accurate and reliable predictor for the structure and function of antimicrobial peptides and receptors. This conceptual model will be respect of applying for guiding the design of new drugs.

研究受体和抗菌肽的结构、功能和定位信息已成为当前生物学和药理学研究热点问题,但通过生物实验方法确定这些信息存在很多问题,如成本高、周期长,甚至有些当前的技术还无法实现。随着网络及信息技术的发展,使得获取不同尺度、不同层面的多源生物信息成为可能。本项目将融合蛋白质元胞自动机图(反映不同位置氨基酸的相互影响)、物理化学属性矩阵图(反映氨基酸之间的物理化学属性关系)、PSSM矩阵图(反映序列中氨基酸的遗传进化信息)、GO(Gene Ontology)和功能域等信息,比仅利用单信息源或非协调利用部分多源信息获取更精确和更稳健的性能,而蛋白质离散灰色模型、模糊K近邻、支持向量机等模式识别算法所提供的互补信息进一步提高融合决策的精度。项目还将设计出一种高效的多标签分类器,与现有ML-KNN、神经网络等算法进行集成最终实现准确可靠的预测抗菌肽和受体的结构和功能。此概念模型对指导新药设计具有应用前景。

项目摘要

随着人类基因组计划的实施和推进,生物序列数据呈几何级数增长,迫切需要设计新的模型和发展新的理论、方法、技术和工具。研究受体和抗菌肽的结构、功能和定位信息已成为当前生物学和药理学研究热点问题。随着网络及信息技术的发展,使得获取不同尺度、不同层面的多源生物信息成为可能。本项目融合蛋白质元胞自动机图、物理化学属性矩阵图、PSSM矩阵图、GO和功能域等信息,比仅利用单信息源或非协调利用部分多源信息获取更精确和更稳健的性能,而蛋白质离散灰色模型、模糊K近邻、支持向量机等模式识别算法所提供的互补信息进一步提高融合决策的精度。项目设计出了三种高效的多标签分类器:1)综合考虑特征信息和近邻标记信息的多标签分类器hMuLab;2)一种适用于多标记学习的深度网络结构;3)多标签高斯核回归算法ML-GKR。.基于三种新的多标签预测算法,设计了GPCR、受体和抗菌肽等常见药物靶点序列结构和功能分类预测软件,这些模型能判断未知蛋白质和肽链是否为受体和抗菌肽,以及属于何种受体、具有何种功能等,提高药物靶点发现的效率。项目设计了基于融合技术的蛋白质-药物靶点结合预测算法。融合蛋白质伪氨基酸成分方法、药物结构分子指纹和智能计算方法,能有效提高预测率,靶标蛋白包括了G蛋白偶联受体、离子通道、酶以及核受体等四种重要的药物靶标蛋白。上述成果已经用于药物靶点的发现中,有效的提高了基因药物设计的效率。项目设计了蛋白质-蛋白质是否结合预测器、蛋白质结合位点预测器、抗冻蛋白质预测器、膜蛋白结构类型多标签预测器、动物蛋白亚细胞多标签定位预测器、酶蛋白功能多标签预测器、DNA复制起始位点预测器、核小体位置预测器和多种蛋白质和DNA翻译后修饰位点等在线预测器。这些在线预测器访问量超过5万余次,为广大生物学者提供了帮助。项目发表论文有两篇入选2015年中国最具国际影响力百篇论文,SCI他引次数超过600余次.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

肖绚的其他基金

批准号:31860312
批准年份:2018
资助金额:39.00
项目类别:地区科学基金项目
批准号:60961003
批准年份:2009
资助金额:18.00
项目类别:地区科学基金项目
批准号:41061020
批准年份:2010
资助金额:26.00
项目类别:地区科学基金项目
批准号:31560316
批准年份:2015
资助金额:40.00
项目类别:地区科学基金项目
批准号:60661003
批准年份:2006
资助金额:24.00
项目类别:地区科学基金项目

相似国自然基金

1

基于多源信息融合的蛋白质结构域折叠模式预测模型研究

批准号:61602100
批准年份:2016
负责人:张丽超
学科分类:F0213
资助金额:20.00
项目类别:青年科学基金项目
2

基于多源信息融合的蛋白质功能预测方法研究

批准号:61903106
批准年份:2019
负责人:李满枝
学科分类:F0305
资助金额:25.00
项目类别:青年科学基金项目
3

基于多源信息融合的蛋白质相互作用预测研究

批准号:60775012
批准年份:2007
负责人:张绍武
学科分类:F0605
资助金额:28.00
项目类别:面上项目
4

基于多源海量数据分层递阶图表示模型的可视化信息融合与预警方法

批准号:70871101
批准年份:2008
负责人:宋之杰
学科分类:G0107
资助金额:24.00
项目类别:面上项目