分形与统计相关方法在蛋白质亚细胞定位及功能预测中的应用

基本信息
批准号:11401503
项目类别:青年科学基金项目
资助金额:23.00
负责人:韩国胜
学科分类:
依托单位:湘潭大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:王熙逵,石龙,宋玉琴,刘金龙,李宝根
关键词:
多标签学习分形蛋白质亚细胞定位蛋白质功能统计
结项摘要

With the development of biotechnology and bioinformatics, biological data have increased in exponential way every year. It is not really practical to analyze such mass data alone by performing expensive and time-consuming biochemical experiments. To meet such requirement, it is extremely urgent to develop reliable and effective computational methods and algorithms. Fractal and related methods are important methods in nonlinear science. Fractal and statistical methods have been widely used in bioinformatics. This project focuses on the application of fractal and statistics related method to the problems of protein subcellular localization and protein function prediction in bioinformatics. The research contents of our project include: developing some methods for the prediction of protein subcellular locations and functions based on the fractal and statistics related methods, and hope to be helpful for further research of related problems; developing some efficient numerical representations and sparse network representations for protein sequences; developing some new feature extraction methods based on nonlinear science methods and statistical methods; getting the key feature information related to the prediction of protein subcellular locations and functions; developing efficient multi-label algorithms for the prediction of protein subcellular locations and functions; design web-servers of related problems for researchers in bioinformatics.

随着生物技术的不断进步与生物信息学研究的不断深入,生物学数据每年在以指数级增长。仅仅靠既昂贵又耗时的生化实验来分析这海量级数据及其相关的生物学问题,已不太现实。为适应这种需求,研发可靠高效的计算方法和算法已迫在眉睫。分形及相关方法是非线性科学中重要的方法。分形和统计方法在生物信息问题中已广为应用。本项目重点研究分形与统计相关方法在生物信息学中的蛋白质亚细胞定位及功能预测等热点问题中的应用。我们的研究内容包括:发展一套基于分形及统计相关方法的蛋白质亚细胞定位及功能预测的方法,希望有益于相关问题的进一步研究;发展出一些有效的蛋白质序列转化的数值序列表示与稀疏网络表示方法;发展原有的非线性科学方法和统计方法,提出新的特征提取方法;挖掘与蛋白质亚细胞定位及功能预测紧密相关的特征信息;发展有效的蛋白质亚细胞定位及功能预测的多标签学习算法;构建相关问题的生物信息学平台,供研究人员使用。

项目摘要

本课题组基于分形和统计方法,系统研究了蛋白质亚细胞定位和功能预测问题。(1) 首先针对蛋白质亚细胞位置的多重属性,我们提出了一种新的多标签学习算法(正则化的径向基函数网络模型),对于多个标准数据集我们模型的性能都是最优的。 (2) 基于氨基酸物理化学特性,我们获得了蛋白质一级结构的水平可视图表示,这个表示方法提取的网络特征充分考虑了氨基酸残基间的长程相关性,在两个标准数据集上的性能证实了我们方法的有效性。(3) 针对宏基因组数据,我们提出了一种有效的可视化模型--内核苷酸距离谱,在三个标准数据集上的最终结果显示内核苷酸距离谱可以作为基因组的签名特征。(4) 我们提出一个新的序列表示方法—高阶马尔可夫表示,这个模型充分考虑了序列中字符的顺序关系,整个模型不需要参数选择。在标准数据集上,我们的方法不仅优于传统方法的而且在计算上有明显的优势。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

氯盐环境下钢筋混凝土梁的黏结试验研究

氯盐环境下钢筋混凝土梁的黏结试验研究

DOI:10.3969/j.issn.1001-8360.2019.08.011
发表时间:2019
5

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016

韩国胜的其他基金

批准号:81101906
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

分形及相关方法在分子进化与蛋白质研究中的应用

批准号:11371016
批准年份:2013
负责人:喻祖国
学科分类:A0204
资助金额:62.00
项目类别:面上项目
2

分形及复杂网络方法在低同源蛋白质结构类预测中的应用

批准号:11626187
批准年份:2016
负责人:赵志琴
学科分类:A0204
资助金额:3.00
项目类别:数学天元基金项目
3

分形及相关方法在时间序列分析与复杂网络研究中的应用

批准号:11071282
批准年份:2010
负责人:喻祖国
学科分类:A0204
资助金额:30.00
项目类别:面上项目
4

分形与序列复杂度方法在DNA调控元件预测中的应用

批准号:11671003
批准年份:2016
负责人:胡学海
学科分类:A0204
资助金额:48.00
项目类别:面上项目