基于海量样本的高性能元基因组数据分析策略和方法开发

基本信息
批准号:31271410
项目类别:面上项目
资助金额:80.00
负责人:宁康
学科分类:
依托单位:华中科技大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:苏晓泉,张颖,卫亚平
关键词:
功能注释海量样本高性能分析物种和功能结构元基因组
结项摘要

Metagenome based on next-generation DNA sequencing technology is one of the most important means of understanding the structure and function of microbial community. However, firstly, the amount of metagenomic samples was increasing rapidly; secondly, metagenomic datasets have different type, source and quality; thirdly, different biological questions need the analysis method to be multi-fucntional, high-speed and adaptive to different data. As such, current metagenomics data analysis is still dependent on human experience, and there is urgent needs for systematic, reliable and standard metagenomic data analytical method. To trackle this bottleneck, this study would select a large number of metagenomic samples, and systematically investigate the effect of varies factors that could affect the analysis strategy and results for metagenomic data analysis, such as the complexity structure (taxonomy and function), data type (evolutionary marker such as 16S rRNA, or whole genome sequencing), sequence type (454 or Solexa) and sequencing depth, etc. Then by using data mining methods, we will summarize the effect of the above factors on the results of metagenomic data analysis, and propose a biologically meaningful and representative parameter matrix that could be applied on different metagenomic data analysis. Finally, we will propose a general method and pipeline for metagenomic data analysis, and establish of a database of parameters and supporting data. This analysis method, together with the parameter matrix, could facilitate a series of metagenomic data analysis objectives, such as the analysis of taxonomical and functional structure analysis of microbial community, metagenome assembly and gene annotation in metagenome.

基于新一代DNA测序技术的元基因组方法是认识微生物群落结构和功能的最重要手段之一。但是,首先,目前元基因组数据量呈爆炸式上升趋势;其次,元基因组数据在类型、来源、质量上十分复杂;最后,基于元基因组数据的不同科学问题,对其分析方法提出了广谱性、多功能与高速度等挑战。这些挑战和困难的存在,导致目前对于元基因组数据解析仍处于经验化阶段,缺乏系统、可靠、可参照的分析方法。针对该瓶颈,本项目通过选择海量元基因组样本,系统考察群落的数据类型(16S rRNA等进化标记或全基因组测序)、序列类型(454或Solexa)以及测序深度等若干因素对基于元基因组数据的不同科学问题分析策略的影响。进而运用数据挖掘等方法,总结上述因素影响机制的共性、特性和互相影响,提出具一定参照意义、代表性与通用性的技术参数矩阵。最终开发通用的元基因组数据分析方法,并建立相关分析策略参数和支撑数据的数据库,服务于元基因组研究。

项目摘要

基于新一代DNA测序技术的元基因组方法是认识微生物群落结构和功能的最重要手段之一。但是,首先,目前元基因组样本量呈爆炸式上升趋势;其次,元基因组数据在类型、来源、质量上十分复杂;最后,基于元基因组数据的不同科学问题,对其分析方法提出了广谱性、多功能与高速度等挑战。这些挑战和困难的存在,导致目前对于元基因组数据解析仍处于经验化阶段,缺乏系统、可靠、可参照的分析方法。针对该瓶颈,本项目通过选择海量元基因组样本,系统考察群落的数据类型(16S rRNA等进化标记或全基因组测序)、序列类型(454或Solexa)以及测序深度等若干因素对基于元基因组数据的不同科学问题分析策略的影响。进而运用数据挖掘等方法,总结上述因素影响机制的共性、特性和互相影响,提出具一定参照意义、代表性与通用性的技术参数矩阵。最终开发通用的元基因组数据分析方法和流程,并建立相关参数和支撑数据的数据库,服务于元基因组研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

宁康的其他基金

批准号:31871334
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:31671374
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:61103167
批准年份:2011
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

代谢组学数据高性能分析方法与整体策略研究

批准号:21675174
批准年份:2016
负责人:卢红梅
学科分类:B0310
资助金额:65.00
项目类别:面上项目
2

基于元基因组相似度计算的海量微生物群落数据挖掘

批准号:61303161
批准年份:2013
负责人:苏晓泉
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
3

基于图数据库理论的海量RDF数据存储和查询方法研究

批准号:61003009
批准年份:2010
负责人:邹磊
学科分类:F0202
资助金额:19.00
项目类别:青年科学基金项目
4

基于海量、多域、高维数据挖掘的中医疗效分析方法研究

批准号:81774138
批准年份:2017
负责人:郭艳
学科分类:H3302
资助金额:55.00
项目类别:面上项目