基于字符模式统计规律关于宏基因组的统计及计算分析研究

基本信息
批准号:11371227
项目类别:面上项目
资助金额:50.00
负责人:栾贻会
学科分类:
依托单位:山东大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:孙丰珠,刘广臣,邓伟,魏玮,单昂,武洪萍,孙晗梅,钱琨
关键词:
模式隐马氏链信息短串分布逼近宏基因组
结项摘要

A metagenomics sample refers to all the genomes of a microbial community in the specific environment (such as human intestinal, etc.). It's crucial to understand how environment and genes interact to affect human health. High throughput sequencing technologies make it possible to study the organisms that occur in these systems and to infer the biochemical and regulatory pathways that are present. But current approaches to analyze the massive quantity of available data are limited in their ability to find patterns and relationships among the organisms and pathways. The objective of this research is to develop novel computational and statistical methods and relevant software packages for the comparison of microbial communities based on short sequence reads. Such sequence-based comparisons of microbial communities provide a powerful tool to understand highly complex communities. The proposal involves the following studies: (1) to develop the probability distribution theory for the number of occurrences of word patterns in metagenomic communities consisting of mixture of genomes, (2) to develop novel efficient statistics for the comparisons of metagenomic communities using word patterns, and (3) to integrate current different approaches for the comparison of metagenomic communities using both tag sequences and word patterns. In addition, we will also develop publicly-available software packages for all relevant researchers.

宏基因组指特定环境 (如人类肠道等)中微生物群落所有物种的基因组,深入研究这些微生物群落的构成情况、相互作用及其变化情况,对于分析环境与基因相互作用对人类健康的影响具有重要的意义。高通量测序技术使得人们研究这些群落内的有机体、推断它们的生化和调控通路成为了可能。本课题的研究目标是发展基于序列特征的统计计算方法用于微生物群落比较,并提供相应的软件包,为人们更好地理解高度复杂的微生物群落提供有效的工具。本项目将研究宏基因组学的以下重要问题:1)发展由多个基因组构成的宏基因组群落中字符模式出现次数的概率分布理论;2)基于字符模式提出新的有效的用于宏基因组群落比较的非序列比对统计量;3)将标签序列和字符模式结合起来,提出宏基因组比较综合方法。此外,我们将得到的相关宏基因组比较理论成果转化为分析算法软件供研究者无偿使用。

项目摘要

本课题的研究总体上是按照项目计划书所列的内容进行的, 完成了项目申请书中的基本研究内容和基本目标,取得了预期的研究目标。对于目前普遍采用的非序列比对的相似性度量进行了有价值的修正;在DNA序列可视化研究方面有了新的进展;在DNA序列中识别蛋白质编码区域方面有了一定的研究结果。到目前为止,本课题组已发表的学术期刊(SCI收入)论文5篇,此外还有投稿3篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
4

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
5

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022

栾贻会的其他基金

批准号:11071146
批准年份:2010
资助金额:26.00
项目类别:面上项目
批准号:10441004
批准年份:2004
资助金额:7.00
项目类别:专项基金项目

相似国自然基金

1

序列模式识别统计功效的分析研究

批准号:11071146
批准年份:2010
负责人:栾贻会
学科分类:A0403
资助金额:26.00
项目类别:面上项目
2

基于文献数据的科研兴趣转移行为模式及统计规律的研究

批准号:61603309
批准年份:2016
负责人:贾韬
学科分类:F0304
资助金额:20.00
项目类别:青年科学基金项目
3

基于全基因组概括关联统计量的统计建模与推断

批准号:11771463
批准年份:2017
负责人:郭小波
学科分类:A0403
资助金额:48.00
项目类别:面上项目
4

关于有序数据的统计推断

批准号:11071035
批准年份:2010
负责人:高巍
学科分类:A0402
资助金额:26.00
项目类别:面上项目