The development of DNA sequencing makes many bacterial genomes are available. However, how to analyze large-scale microbial genome data efficiently and accurately has become a bottleneck in microbiologist research work. The pan-genomics concept provides biologists new ideas in systematic comparative genomic analysis from population insight. And it is becoming more and more important in lots of research fields, such as genomics evolution, genomics adaptability and pathogenic mechanisms. Many scientists have studied deeply on comparative genomics analysis methodology in many ways, but there are still lack of pipeline and algorithms to analyze the genome dynamics and plasticity efficiently from population insight. Therefore, we propose here that we will build up a new methodology to do bacteria comparative genomics information mining, which centers on pan-genomics analysis and targets at those four problems descripted above. We will design a brand new orthologous gene cluster identification algorithm specified for bacteria and integrate all reliable comparative genomics analysis methods. The bacteria multi-genomics comparative analysis software package will be developed based on this methodology, which will be a basically technical support to microbial comparative genomics analysis.
测序技术飞速发展使得微生物基因组测序数量迅猛增长,而高效、准确地解析大规模微生物基因组数据已经成为微生物学家研究工作中的一项瓶颈。泛基因组学概念的提出为生物学家从群体角度进行系统的比较基因组学分析开辟新思路,并被广泛应用于微生物基因组演化、适应性、致病性机制等研究中。目前尚缺乏能对多基因组进行深入比较分析,以揭示微生物基因组动学和可塑性等生物学问题的高效分析算法和流程。本项目致力于原核微生物多基因组信息挖掘的新算法研究,以泛基因组分析为核心,依照微生物基因组结构特征设计物种间直系同源基因鉴定的新算法,整合和开发微生物基因组分析工具,从群体角度发展基因组动力学演化机制深度解析算法和流程,最终立一套能进行大量原核微生物基因组信息挖掘以及数据可视化的新方法,为原核微生物比较基因组学分析提供高效准确的技术支持。
基因组测序技术快速发展使得原核生物基因组测序数量指数级增长,亟需发展新的泛基因组分析方法高效、准确地解析大规模原核生物基因组数据。本项目致力于原核生物基因组信息挖掘的新算法研究,以泛基因组学分析思想为核心,依照原核生物基因组结构特征设计物种间直系同源基因鉴定的新算法,从群体角度发展原核生物泛基因组深度解析新算法和流程,主要包括基因家族鉴定和菌株演化分析、泛基因组特征分析、多基因组比较分析方法以及分析结果可视化等,最终建立了一套能进行大规模原核生物基因组信息挖掘以及数据可视化的新方法。同时,基于docker技术开发了具有良好移植性、简单易用的原核生物泛基因组在线分析平台,该平台整合了多种数据分析方法,并从基因组动力学和结构上进行泛基因组分析,为用户提供了便捷的数据分析平台。进一步利用新开发的软件和在线分析平台,对古细菌和细菌的防御系统相关基因进行了整合分析,构建了原核生物防御系统基因数据库(PADS Arsenal),系统揭示了不同防御系统的分布和演化规律。本研究为从群体角度进行原核生物基因组数据解析和研究基因组动力学演化机制提供了新方法和在线分析平台。完成了项目申请时的预期目标,共发表学术论文8篇,其中SCI收录论文6篇,获软件著作权3项,培养研究生5名,其中博士研究生2名。
{{i.achievement_title}}
数据更新时间:2023-05-31
"多对多"模式下GEO卫星在轨加注任务规划
智能煤矿建设路线与工程实践
强震过程滑带超间隙水压力效应研究:大光包滑坡启动机制
铁路大跨度简支钢桁梁桥车-桥耦合振动研究
重大生物事件与化石能源形成演化--兼论地球系统框架下能源学发展
基于深度学习框架的社交媒体信息挖掘
基于不同类型基因组蛋白质编码基因共性信息挖掘的微生物基因组重注释
人体基因组嵌合突变鉴定与定量的生物信息新方法开发及突变规律挖掘
微生物漆酶数据挖掘及底物杂泛性分析