元基因组中复杂结构的序列模块寻找及其功能分析

基本信息
批准号:61472246
项目类别:面上项目
资助金额:80.00
负责人:韦朝春
学科分类:
依托单位:上海交通大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:吴茂英,许华勇,胡智强,贾犇,曹单峰,谢俊,于雪琳,王艳玲,Jeffery Floyd Miller
关键词:
DGR高通量测序序列模块隐马尔科夫模型元基因组学
结项摘要

Sequence modules, such as CRISPR and DGR, have complex sequence structures and play important roles in the immune and evolution of microbes. Metagenomics studies the composition and function of the microbial community by sequencing directly all genetic materials from an environment. It is one of the best methods for the study of the activeness and potential functions of those sequence modules with complex structures. Currently, there are thousands of metagenomes sequenced, and a fast analysis tool is in a great demand to find and analyse those sequence modules with complex structures in metagenomes. This project plans to creat a system to find and analyse sequence modules with complex structures in metagenomes. Statistics model based sequence module finding system will be integrated with metagenome sequence analysis methods such as metagenome assembly to create the system. CRISPR and DGR finding in metagenomes will be shown as examples of system applications, and new sequencing platforms with long read lengths will be applied to verify the prediction accuracy in gut metagenomes. This project will provide important tools and resources for a new generation of metagenomics.

近年来发现的一系列具有复杂结构的序列模块,如CRISPR以及DGR等,在微生物的免疫及进化中具有重要功能。元基因组学通过直接测序的方法分析特定环境中群落的自然组成结构及功能等,是研究这些复杂结构序列模块的活性和潜在功能最佳的方法之一。目前已经有成千上万个元基因组的高通量测序数据,在这些海量元基因组数据集中准确寻找并分析这些复杂结构的序列模块需要一个高速分析方法和系统。本项目拟针对元基因组序列数据,通过引入基于统计模型的复杂结构序列模块预测模型,并结合现有元基因组序列拼接等分析方法和系统,开发寻找和分析复杂结构序列模块的自动系统。本系统将以寻找和分析不同元基因组中CRISPR以及DGR等序列模块为实例展示系统的应用,并通过读长较长的新一代测序技术验证在肠道菌元基因组中的预测结果。本项目的展开,将对元基因组学的进一步发展和应用提供比较重要的工具和资源,具有相当重要的理论意义和实际应用价值。

项目摘要

本项目旨在针对元基因组数据开发一个通用的复杂结构序列模块识别系统,为元基因组中的CRISPR/DGR等复杂结构的序列模块的预测和比较分析提供工具和参考数据集。项目完成情况如下。.1、开发了元基因组或者元转录组测序数据的高速预处理方法,测序序列的分类方法MetaBinG2.0,可以高速进行元基因组或元转录组数据的物种来源分类,适用于有较多的未知物种的样本,相关论文2018年发表在Biology Direct(影响因子2.77);.2、开发了基于隐马尔可夫模型的DGR序列模块识别系统MetaCSST;将该系统应用到现有的8万多个完整细菌基因组和4000多个人类肠道菌元基因组测序数据中,得到948个非冗余的DGR模块,比现已知的DGR模块数量增加55%;对得到的DGR模块展开分析,发现DGR序列模式及组成元素的不同组合方式和来源物种及所在环境有关联性;并由此发现了DGR导致的突变并不是传统认为的只有A位置上突变,而是A或者T位置突变比较多,而G和C位置的突变率比较低。本研究为深入研究DGR引入了新的研究方法,构建了更加完整的参考序列模块资源。相关论文已经递交(目标期刊PNAS)。.3、将比较基因组学方法推广到3000多个水稻基因组的深度测序数据分析,展开水稻泛基因组分析,发现水稻物种的泛基因组比个体基因组可能多出12000个基因,相关结果2018年发表在Nature (影响因子40.14), 以及Scientific Data (影响因子4.84); 泛基因组的图形化展示系统2017年发表在Nucleic Acids Research(影响因子10.16);真核生物泛基因组分析系统发表2017年发表在Bioinformatics(影响因子7.30)。.已经发表标注本项目资助的SCI论文7篇,影响因子10以上2篇(1篇Nature)。 .培养硕士研究生10人(包括1名国际留学生,毕业5人);博士生5人(1人毕业,2人将于2019年毕业)。参加国际会议交流9人次。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

韦朝春的其他基金

批准号:60970050
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:61272250
批准年份:2012
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

复杂网络中模块结构探测的理论与算法研究

批准号:10701080
批准年份:2007
负责人:王瑞省
学科分类:A0405
资助金额:16.00
项目类别:青年科学基金项目
2

多链DNA结构模块构建的复杂纳米结构

批准号:31570860
批准年份:2015
负责人:魏迪明
学科分类:C2107
资助金额:60.00
项目类别:面上项目
3

新的食管癌相关基因的寻找及其功能分析

批准号:30572103
批准年份:2005
负责人:黄晓平
学科分类:H1826
资助金额:8.00
项目类别:面上项目
4

序列特征研究及其在基因组分析中的应用

批准号:60671018
批准年份:2006
负责人:孙啸
学科分类:F0124
资助金额:25.00
项目类别:面上项目