Prokaryotic pan-genome is defined as the full complement of genes in a species. Acquisition of the pan-genome of a species is crucial for understanding its genetic diversity, genome structure and the relationship between genotypes and phenotypes. Current methods for constructing a pan-genome mainly base on the combination of multiple strain genomes, which are constrained by microbial separation and culture methodologies, thus have limitations in taxonomic breadth. Moreover, the gene content of a pan-genome is not well organized, and the complex but informative data is inconvenient to access and analyse. Emerging high through-put sequencing technologies have made culture-independent metagenomic studies possible and therefore provided researchers with tremendous gene content for currently unknown microorganisms. Here we propose to develop a bioinformatic tool for construction and investigation of prokaryotic pan-genome based on metagenomic data. We aim to accurately extract the whole gene content of a given species from currently available metagenomic data set, and organize the pan-genome using a gene network topological structure to make maximized reservation of the original genome structure. Finally, we will visualize the pan-genome using a user-friendly interface, to provide researchers with a straight-forward, convenient and efficient strategy and tool for prokaryotic pan-genome study. This tool will become a powerful platform for subsequent biological mechanism research and related application development.
原核微生物泛基因组是指特定菌种下所有菌株的基因的并集,获取每个菌种的泛基因组信息,对于研究其遗传多样性、理解基因组结构和解读基因型-表型关系至关重要。现有针对特定菌种构建其泛基因组的方法主要依赖测序菌株基因组数据库,受菌株分离培养手段限制,覆盖物种宽度有限;缺乏有效组织其中的基因信息的方法;数据信息丰富但缺乏的直观分析手段。随测序技术发展,宏基因组研究开辟了微生物研究不依赖单菌分离培养的新平台,为研究者提供了大量前所未知微生物基因资源。本项目拟研发一款基于宏基因组数据构建原核微生物泛基因组的分析工具。从现有环境微生物样品的宏基因组测序数据中,提取指定菌种的全部基因信息,以基因网络的形式来组织和构建其泛基因组,最大限度保留基因组结构信息。并且实现菌种泛基因组网络的可视化,为研究者提供直观、便捷、高效的原核微生物泛基因组分析策略和方法,为后续的生物学机制研究和应用开发提供有力的平台。
在分子生物学中,泛基因组是指在一个进化分支下所有基因的集合。属于同种细菌或古菌的不同菌株,其生态位、功能可能相差甚远。一般情况下,菌种的泛基因组的基因信息要比单一菌株更为丰富,而对于一个具体菌种的泛基因组的构建,将大大促进这类原核微生物的遗传多样性的研究。然而,现有泛基因组研究工具主要关注基因序列信息,忽略了基因在基因组中的前后位置关系信息;另一方面,现有泛基因组可视化工具通常以线性方式进行展示,当进行比较的基因组数量增多时此种方法的展示结果可读性较差,且无法便捷地获取基因的生物学注释;此外,现有工具不能实现对数量庞大且不断增长的通过宏基因组鸟枪法测序所获得的微生物组数据进行有效挖掘。.为填补泛基因组研究中的这些空缺,本项目开发了一个名为MetaPGN的分析工具,该工具可利用单菌基因组或宏基因组组装序列,实现对基因信息及基因间连接关系的提取,并以参考基因组为骨架构建泛基因组网络,最后在开源的网络数据展示平台Cytoscape中,使用本项目开发的插件对网络图进行排布和交互式分析。.相比传统工具,MetaPGN能够以基因网络的形式,更好地排布和呈现原核微生物的泛基因组,其突出优势具体表现为以下三个方面:首先,把基因间的连接关系囊括进泛基因组分析,有利于发现结构变异,同时可对未知功能基因进行定位,进而推测其可能参与的生物学过程,指导下游的功能验证实验设计;其次,以网络图的方式组织泛基因组,并在Cytoscape平台上对其进行呈现,一方面可以避免冗余信息的反复出现,另一方面可实现交互式地对泛基因组网络上的元素进行遍历、搜索、个性化展示,亦可方便地获取各元素的生物学注释信息,可促进新变异的发现和解释;最后,该工具首次提供了一个基于宏基因组组装序列进行泛基因组研究的方案,这将极大丰富可用于泛基因组研究的数据来源,尤其有助于对现有实验条件难以培养的物种的研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
基于宏基因组测序数据的微生物基因组序列鉴定及群落比较方法研究
基于家系基因组测序数据的拷贝数变异检测方法研究
微生物泛基因组信息深度挖掘新方法研究
基于低深度测序数据的全基因组关联研究