基于多源信息融合的蛋白质亚细胞定位预测算法研究

基本信息
批准号:61272312
项目类别:面上项目
资助金额:80.00
负责人:姚玉华
学科分类:
依托单位:浙江理工大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:贺平安,聂作明,南旭莹,李晓芳,魏进周,孔芬,韩建宁,石卓兴
关键词:
信息获取信息融合蛋白质亚细胞定位模糊神经网络
结项摘要

Protein subcellular localization prediction is important to study protein function, protein interaction and their regulation mechanism. This project aims at problems related to protein information extraction, selection and integration, and focuses on how to extract protein sequence and structure information, to select key information, search for the effective predict strategy. The main contents include: with comprehensive utilization of multivariate statistics, the LemZiv algorithm and computational geometry method, we effectively extract multiple information including protein conserved information, complexity information, component information and global information; As for protein structure information, we introduce the multi variables thought and design an effective statistical algorithm to obtain a comprehensive protein structure information; with the characteristics of multi-source information in mind, we select the protein core information with help of random forest method; Using fuzzy neural network classification strategy, we integrate the multiple features to improve the prediction accuracy. This research is based on the existing test data, and has abundant stable, independent data to validate. The research results of this project not only contribute to protein properties and functional studies, but also to the study of protein-protein interactions and the development of new drugs. Besides, this project can offer new ideas for Proteome information analysis and algorithm design.

蛋白质亚细胞定位预测对蛋白质的功能、相互作用及调控机制的研究具有重要意义。本项目针对定位预测中信息的提取、挑选及融合等问题展开,重点研究如何充分提取蛋白质序列及结构信息,挑选核心信息,寻找预测策略的有效建模方法。主要内容包括:综合利用多元统计、LemZiv算法及计算几何方法,有效地提取包含蛋白质保守信息、复杂度信息、组分信息和全局信息的多重信息;在蛋白质结构信息获取中引入多变量的思想,寻找有效的统计算法,获取全面的蛋白质结构信息;针对多源信息的特点,结合随机森林方法,挑选蛋白质的核心信息;基于模糊神经网络的分类策略研究,更好地融合多个层次的特征,提高定位预测的准确率。本项目研究基于现有的测试数据展开,同时拥有充足、稳定的独立数据加以验证。本项目的研究成果将有助于蛋白质性质和功能的研究,可对蛋白质相互作用研究及新药物的开发提供借鉴和参考,还可为蛋白质的信息分析和应用算法设计提供新的思路。

项目摘要

蛋白质亚细胞定位的研究与阐述各种细胞过程的功能密切相关,对一些疾病机制和发展新型药物也有着重要的作用。传统的生物化学实验方法周期长、成本高,因此基于机器学习的蛋白质亚细胞定位预测成为了当前生物信息学的重要研究内容之一。本项目针对定位预测中信息的提取、挑选及融合等问题展开,重点研究如何充分提取蛋白质序列及结构信息,挑选核心信息,寻找预测策略的有效建模方法。..主要内容包括:综合利用AAindex数据库挖掘、基于PSI-BLAST同源比对、基于蛋白序列黄金比例分段、氨基酸的进化保守信息、蛋白质序列的共有序列组分信息和基因本体论信息、蛋白质序列Gapped k-mer的信息,有效地提取包含蛋白质保守信息、复杂度信息、组分信息和全局信息的多重信息;在蛋白质结构信息获取中引入多变量的思想,寻找有效的统计算法,获取全面的蛋白质结构信息;针对多源信息的特点,结合随机森林方法,挑选蛋白质的核心信息;基于模糊神经网络和支持向量机的分类策略,更好地融合多个层次的特征,显著提高了定位预测的准确率。..本项目研究基于现有的测试数据展开,同时拥有充足、稳定的独立数据加以验证。本项目的研究成果将有助于蛋白质性质和功能的研究,可对蛋白质相互作用研究及新药物的开发提供借鉴和参考,还可为蛋白质的信息分析和应用算法设计提供新的思路。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
3

视网膜母细胞瘤的治疗研究进展

视网膜母细胞瘤的治疗研究进展

DOI:
发表时间:2018
4

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

DOI:10.7506/spkx1002-6630-20190411-143
发表时间:2020
5

当归补血汤促进异体移植的肌卫星细胞存活

当归补血汤促进异体移植的肌卫星细胞存活

DOI:
发表时间:2016

姚玉华的其他基金

相似国自然基金

1

基于多源信息融合的蛋白质功能预测方法研究

批准号:61903106
批准年份:2019
负责人:李满枝
学科分类:F0305
资助金额:25.00
项目类别:青年科学基金项目
2

基于多源信息融合的蛋白质相互作用预测研究

批准号:60775012
批准年份:2007
负责人:张绍武
学科分类:F0605
资助金额:28.00
项目类别:面上项目
3

蛋白质亚线粒体定位及其特征信息和预测算法的挖掘

批准号:61461038
批准年份:2014
负责人:樊国梁
学科分类:F0124
资助金额:36.00
项目类别:地区科学基金项目
4

基于多源信息融合的蛋白酶裂解位点预测算法研究

批准号:11601324
批准年份:2016
负责人:刘太岗
学科分类:A0604
资助金额:18.00
项目类别:青年科学基金项目