The accurate annotation of protein function is the key of understanding life at the molecular level. With the development of sequencing technology, there are more and more genomes sequenced. For most of the whole genome sequencing projects, the function of a large fraction of proteins remain unknown. This makes the gap widen between the protein sequences and the known functional proteins. Providing accurate functional annotation is one of the challenges and tasks in the post-genomics era. Using Gene Ontology as the functional landscape, first the genes will be classified based on the synteny results, and then the genes will be annotated by different methods according to different categories. Biology process and molecular function will be used different integration strategies. The alternative transcripts will be annotated by the classifier of multiple instances. The ab inito function prediction will be used. Through the comprehensive application and optimization of these methods, we can improve the accuracy and coverage of functional annotation. Our study will be crucial for proteome research.
准确地注释蛋白质的功能是在分子水平上理解生命活动的关键。随着测序技术的发展,我们所能获得的基因组越来越多,但是基因组的功能注释却滞后于结构注释,这样使得基因序列与功能之间的差距越来越大,基因组的功能注释是后基因组时代面临的巨大挑战和任务之一。本研究以Gene Ontology为功能注释的标准,基于共线性结果对基因进行分类,对不同类别的基因将采取不同的注释方法,利用证据整合时,对于蛋白质的生物学过程和分子功能等将采用不同的整合策略;并且通过多实例分类器的引入来实现对同一基因不同可变剪切体的注释;同时我们将重头开始的预测方法也引用注释系统。通过这些方法的综合应用与优化,以期实现在准确度达到一定程度上对蛋白质的广度预测,我们的研究对于蛋白质组学的研究将具有重要的意义。
准确地注释蛋白质的功能是在分子水平上理解生命活动的关键。随着测序技术的发展,我们所能获得的基因组越来越多,但是基因组的功能注释却滞后于结构注释,这样使得基因序列与功能之间的差距越来越大,基因组的功能注释是后基因组时代面临的巨大挑战和任务之一。在国家自然科学基金资助下,我们对基因组的功能注释进行了研究,并应用于黄瓜基因组上。我们选择了葫芦科及其相关15个被子植物进行共线性识别,并对识别的共线性进行分类和整合证据的方法打分,进而完成对黄瓜基因组功能的准确注释;我们进一步通过变异数据得到了影响蛋白质功能的一些因子(如结构域和蛋白相互作用网络中的hub蛋白等),进而为我们的后续预测提供依据;同时我们对黄瓜基因的可变剪切体功能也进行了研究,并对黄瓜基因组在可变剪切体水平上进行了功能注释;最后我们将这些研究结果通过数据库的组织形式,以WWW的方式供相关研究者共享,我们的研究对于功能基因组学的研究将具有重要的意义。在本项目的资助下,共完成论文4篇(均发表在SCI收录的国际学术刊物上)和两个数据库(基于共线性注释数据库http://cmb.bnu.edu.cn/functional_annotation/和可变剪切体及其功能的注释数据库http://cmb.bnu.edu.cn/alt_iso/index.php)。另有一篇论文已经进入SCI收录的国际学术刊物上的“Minor revision”状态。在本项目的资助下,本课题组培养了多名优秀的硕士、博士研究生。
{{i.achievement_title}}
数据更新时间:2023-05-31
路基土水分传感器室内标定方法与影响因素分析
基于多模态信息特征融合的犯罪预测算法研究
基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
整合RNA-Seq分析的植物基因组注释系统研究- - 以黄瓜属近缘基因组进化分析为例
基于ORF水平质量控制的蛋白质基因组学对酵母基因组注释的研究
基于不同类型基因组蛋白质编码基因共性信息挖掘的微生物基因组重注释
能量限制致鸡脾脏差异表达基因的鉴定与功能注释