基于集成学习的全基因组水平上大规模高可信蛋白质相互作用网络构建及其功能研究

基本信息
批准号:61373086
项目类别:面上项目
资助金额:73.00
负责人:尤著宏
学科分类:
依托单位:深圳大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:李付海,姜亮,崔来中,蔡式东,蔡平,陈平,刘刚,王方晓,赵建伟
关键词:
生物信息学蛋白质组学集成学习极限学习机智能计算
结项摘要

Protein-protein interactions play a central role in life processes at the molecular level.Construction and function analysis of high-quality large-scale protein-protein interaction networks on a genome-wide scale is a hot issue in bioinformatics today. The intensive researches of the prtoein-protein interaction networks are expected to discover the functions and behavior of genome through systematic point of view. In the project, we investigate the feature eneoding seheme of protein pairs and then predict the protein-protein interactions and protein functions, which will facilitate the understanding of life activeties, clinical therapeutics and pharmaceutical design. First of all, a novel protein encoding method is developed by combining physicochemical properties of amino acid residues, global and local features information of protein sequence. The two kinds of ensemble learning method, rotation extreme learning machine and parallel extreme learning machine ensemble algorithm, is utilized to prediction protein interactions on a genome-wide scale. Finally, a protein function prediction method based on network topology information and random walk model is proposed.The results of the project will deepen the understanding of molecular mechanismes, and provide the basis for new treatment options and drug discovery for complex diseases.

随着人们对蛋白质相互作用在生命过程中的重要性认识的不断提高,在全基因组水平上准确构建和分析各模式生物的蛋白质相互作用网络已成为生物信息学领域的一个热点问题。对其研究将有助于更加深入的理解生命现象的本质,并对生命科学的发展起到强有力的推动作用。本项目从蛋白氨基酸序列出发,在序列特征编码、蛋白质相互作用及功能预测方面进行深入研究,以探索蛋白质相互作用及其功能行使的规律与本质。 首先,利用氨基酸残基的理化性质,并结合蛋白质序列的全局和局部特征信息对蛋白质序列进行编码;然后,运用旋转极限学习机森林和并行极限学习机集成这两种特征属性组合和样本组合的集成技术手段,来进行全基因组水平上大规模高可信蛋白质相互作用网络图谱的构建研究。在此基础上,使用基于蛋白质相互作用网络全局拓扑结构信息的随机游走模型对蛋白质功能进行预测和注释。本项目的研究成果将加深对生命的认识,为疾病机理的揭示及新药研发提供理论上的依据。

项目摘要

随着人们对蛋白质相互作用在生命过程中的重要性认识的不断提高,在全基因组水平上准确构建和分析各模式生物的蛋白质相互作用网络已成为生物信息学领域的一个热点问题。对其研究将有助于更加深入的理解生命现象的本质,并对生命科学的发展起到强有力的推动作用。本项目从蛋白氨基酸序列出发,在序列特征编码、蛋白质相互作用及功能预测方面进行了深入研究,以探索蛋白质相互作用及其功能行使的规律与本质。主要研究包括:1)针对目前蛋白质序列结构信息特征提取方法仅侧重全局特征信息或局部特征的问题,提出了一种基于蛋白质序列全局和局部特征集成的编码方式构建方法,研究了新的蛋白质对“对称编码”方法。 (2)提出了一个基于旋转极限学习机森林的蛋白质相互作用预测高性能计算模型,开发了提供高质量蛋白质相互数据的生物信息学平台,为了解蛋白质功能的实现机制和治疗相关疾病的药物设计提供理论依据。(3)针对蛋白质相互作用预测研究中正负类样本的“类不衡”问题及全基因组水平上蛋白质相互作用预测的“大规模”分类问题,提出了基于并行极限学习机集成的蛋白质相互作用预测高性能计算模型。本项目的研究成果对于加深对生命的认识,为疾病机理的揭示及新药研发提供理论上的依据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020
5

结核性胸膜炎分子及生化免疫学诊断研究进展

结核性胸膜炎分子及生化免疫学诊断研究进展

DOI:10.3760/cma.j.issn.1674-2397.2020.05.013
发表时间:2020

相似国自然基金

1

全基因组水平上研究捕食关系对转座子水平转移的影响

批准号:31700318
批准年份:2017
负责人:张化浩
学科分类:C0301
资助金额:25.00
项目类别:青年科学基金项目
2

基于动态模型可信度的集成学习算法研究

批准号:60905030
批准年份:2009
负责人:袁博
学科分类:F0603
资助金额:18.00
项目类别:青年科学基金项目
3

基于集成学习的蛋白质相互作用界面热点残基预测方法研究

批准号:31301101
批准年份:2013
负责人:夏俊峰
学科分类:C0608
资助金额:18.00
项目类别:青年科学基金项目
4

蛋白质相互作用预测的集成学习方法研究

批准号:61300128
批准年份:2013
负责人:曹智
学科分类:F0214
资助金额:25.00
项目类别:青年科学基金项目