本项目研究当前宏基因组学的两个重要的生物信息学问题:序列拼接和基因预测。以正在进行的人肠道微生物组为研究对象,根据宏基因组中随机片段序列的复杂特征,针对细菌和古细菌的基因组结构与序列信息,基于我们近年来在原核生物基因组研究成果的优势,发展一种从短序列片段(包括未拼接的reads和拼接得到的contigs)中预测编码蛋白基因的高效、准确的新方法;设计一种对短序列reads进行序列拼接的新算法,以期得到更长的contig甚至可能的全基因组序列;在序列片段的有效拼接和基因注释的基础上,进一步进行物种组分和优势种群基因组等探索性分析。最终开发出可应用于国际微生物组测序计划的序列拼接和基因注释软件。
本项目研究当前宏基因组学的两个重要的生物信息学问题:序列拼接和基因预测。以正在进行的人肠道微生物组为主要研究对象,根据宏基因组中随机片段序列的复杂特征,针对细菌和古细菌的基因组结构与序列信息,发展了从短序列片段(包括未拼接的reads和拼接得到的contigs)中预测编码蛋白基因的高效、准确的新方法,并开发了相应的软件MetaGun;设计了对短序列reads进行序列拼接的新算法MAP和MA-Pipeline;在序列片段的有效拼接和基因注释的基础上,进一步进行了代谢通路和物种社会关系的探索性分析。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
基于LASSO-SVMR模型城市生活需水量的预测
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于多模态信息特征融合的犯罪预测算法研究
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
基于宏基因组测序数据的微生物基因组序列鉴定及群落比较方法研究
基于序列并整合生物学先验的全基因组预测新方法研究
胃肠道微生物元基因组耐盐酶类及基因的挖掘与分析
BAC克隆高通量测序及短序列拼接方法的研究