基于共线性基因分类的蛋白质功能注释研究——以黄瓜蛋白质功能注释为例

基本信息
批准号:31571361
项目类别:面上项目
资助金额:63.00
负责人:庞尔丽
学科分类:
依托单位:北京师范大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:林魁,宋宏涛,张艳聪,宋佳,郝雨,孙莹
关键词:
功能注释基因组多实例分类器证据整合共线性
结项摘要

The accurate annotation of protein function is the key of understanding life at the molecular level. With the development of sequencing technology, there are more and more genomes sequenced. For most of the whole genome sequencing projects, the function of a large fraction of proteins remain unknown. This makes the gap widen between the protein sequences and the known functional proteins. Providing accurate functional annotation is one of the challenges and tasks in the post-genomics era. Using Gene Ontology as the functional landscape, first the genes will be classified based on the synteny results, and then the genes will be annotated by different methods according to different categories. Biology process and molecular function will be used different integration strategies. The alternative transcripts will be annotated by the classifier of multiple instances. The ab inito function prediction will be used. Through the comprehensive application and optimization of these methods, we can improve the accuracy and coverage of functional annotation. Our study will be crucial for proteome research.

准确地注释蛋白质的功能是在分子水平上理解生命活动的关键。随着测序技术的发展,我们所能获得的基因组越来越多,但是基因组的功能注释却滞后于结构注释,这样使得基因序列与功能之间的差距越来越大,基因组的功能注释是后基因组时代面临的巨大挑战和任务之一。本研究以Gene Ontology为功能注释的标准,基于共线性结果对基因进行分类,对不同类别的基因将采取不同的注释方法,利用证据整合时,对于蛋白质的生物学过程和分子功能等将采用不同的整合策略;并且通过多实例分类器的引入来实现对同一基因不同可变剪切体的注释;同时我们将重头开始的预测方法也引用注释系统。通过这些方法的综合应用与优化,以期实现在准确度达到一定程度上对蛋白质的广度预测,我们的研究对于蛋白质组学的研究将具有重要的意义。

项目摘要

准确地注释蛋白质的功能是在分子水平上理解生命活动的关键。随着测序技术的发展,我们所能获得的基因组越来越多,但是基因组的功能注释却滞后于结构注释,这样使得基因序列与功能之间的差距越来越大,基因组的功能注释是后基因组时代面临的巨大挑战和任务之一。在国家自然科学基金资助下,我们对基因组的功能注释进行了研究,并应用于黄瓜基因组上。我们选择了葫芦科及其相关15个被子植物进行共线性识别,并对识别的共线性进行分类和整合证据的方法打分,进而完成对黄瓜基因组功能的准确注释;我们进一步通过变异数据得到了影响蛋白质功能的一些因子(如结构域和蛋白相互作用网络中的hub蛋白等),进而为我们的后续预测提供依据;同时我们对黄瓜基因的可变剪切体功能也进行了研究,并对黄瓜基因组在可变剪切体水平上进行了功能注释;最后我们将这些研究结果通过数据库的组织形式,以WWW的方式供相关研究者共享,我们的研究对于功能基因组学的研究将具有重要的意义。在本项目的资助下,共完成论文4篇(均发表在SCI收录的国际学术刊物上)和两个数据库(基于共线性注释数据库http://cmb.bnu.edu.cn/functional_annotation/和可变剪切体及其功能的注释数据库http://cmb.bnu.edu.cn/alt_iso/index.php)。另有一篇论文已经进入SCI收录的国际学术刊物上的“Minor revision”状态。在本项目的资助下,本课题组培养了多名优秀的硕士、博士研究生。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
4

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

DOI:10.5846/stxb202009292521
发表时间:2021
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

庞尔丽的其他基金

相似国自然基金

1

整合RNA-Seq分析的植物基因组注释系统研究- - 以黄瓜属近缘基因组进化分析为例

批准号:31171235
批准年份:2011
负责人:林魁
学科分类:C0607
资助金额:60.00
项目类别:面上项目
2

基于ORF水平质量控制的蛋白质基因组学对酵母基因组注释的研究

批准号:31400698
批准年份:2014
负责人:高媛
学科分类:C2103
资助金额:24.00
项目类别:青年科学基金项目
3

基于不同类型基因组蛋白质编码基因共性信息挖掘的微生物基因组重注释

批准号:61302186
批准年份:2013
负责人:于家峰
学科分类:F0124
资助金额:25.00
项目类别:青年科学基金项目
4

能量限制致鸡脾脏差异表达基因的鉴定与功能注释

批准号:31372329
批准年份:2013
负责人:陈文
学科分类:C1705
资助金额:82.00
项目类别:面上项目