微生物必需基因集与联合致死基因集的理论分析与识别研究

基本信息
批准号:31871335
项目类别:面上项目
资助金额:59.00
负责人:郭锋彪
学科分类:
依托单位:电子科技大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:王骄健,董川,靳艳婷,杜萌泽,刘硕,张凯月,高依舟,普东凯,曾志
关键词:
微生物基因重复必需基因特征选择联合致死
结项摘要

Recently, researchers have paid more and more attentions to microbial essential genes and synthetic lethal gene pairs because of their very important functions. This project will focus on S. cerevisiae and E. coli, beginning theoretical analyses and computational identification of essential genes and synthetic lethal gene pair. Firstly, based on multiple algorithms previously proposed, we will adopt machine learning method to develop highly accurate as well as less relying on large scale training set model for predicting essential gene in E. coli specifically. Secondly, we will investigate the association between synthetic lethal effect and biological features such as gene duplication, expression level, quantitative essentiality, physical interaction degree, GO process and pathway and hence extract more effective features to construct model with accurate prediction in this yeast. With the aid of small size of synthetic lethal obtained by text mining or manual collection, we could evaluate the expandability of the model or algorithm in the E. coli. Finally, we will use the refined model to predict synthetic lethal probability of all gene pair and also validate the result by wet experiment of double mutation strains. We hope this project will achieve the general rule of synthetic lethal, and also construct a systematic pipeline for identifying synthetic lethal, and hence provide theoretical reference for the fields of genome reduction, cell chassis and drug designs.

由于极其重要的生物学功能,微生物必需基因的研究受到越来越广泛的关注。本项目将围绕酿酒酵母和大肠杆菌的必需基因和联合致死基因对展开理论分析和计算机识别的工作。首先,在国内外提出的多种识别算法基础上,采用机器学习发展具有极高准确率的且对训练集规模依赖较小的大肠杆菌特异的必需基因识别模型,并推广到只具有部分必需性数据的细菌。其次,作为一个重点内容将分析基因重复、表达水平、定量必需性、物理互作连接度、GO过程或途径等生物特征与联合致死效应间的关联强度,从而提取有效特征建立对于酿酒酵母高度准确的集成模型。借助文本挖掘或手工收集的少量数据在大肠杆菌中测试模型或方法的可扩展性。最后对大肠杆菌完整的基因对进行致死性预测,并通过双删除湿实验评估预测的可靠性。本项目将获得基因间联合致死发生出现的一般规律,并建立联合致死识别的系统流程,从而为精简基因组和细胞底盘、以及药物设计的实验研究提供理论参考。

项目摘要

由于极其重要的生物学功能,微生物必需基因的研究受到越来越广泛的关注。本项目围绕酿酒酵母和大肠杆菌的必需基因和联合致死基因对展开了理论分析和计算机识别的工作。1)对于原核生物必需基因自动化预测模型Geptop进行了升级,包含了更多的参考集数据同时优化了算法,使得运行时间更短并且平均AUC(操作特性曲线下面积)提升了0.02,个别物种中可以提高到0.08;2)升级了必需基因团簇数据库CEG,新版本包含29个原核物种和9个真核物种。基于这些参考集,我们提供了根据团簇比对进行基因必需性预测的服务;3)对于人类必需基因建立了集成模型,联合了六种特征,10重交叉验证的AUC达到0.965。4)从序列组成和多组学实验特征两个角度对于酿酒酵母的联合致死基因进行了计算预测,根据物种交叉验证两种预测方法的AUC均超过0.8;5)建立了微生物联合致死基因数据库,并以此为基础对于重复基因必需性比率较低的问题进行了理论解释。除了必需基因预测和在线数据库构建的内容,项目组还把必需基因应用到了人工细菌基因组这一领域。基于大肠杆菌底盘细胞进行了嵌合细菌基因组的设计,该人工基因组种共包括343个必需基因,其中有172个来源于其他物种,我们正与中科院深圳先进技术研究院合成生物学研究所的研究者合作进行嵌合细菌的合成和细胞激活。. 项目发展的Geptop2.0已经被国内外研究者多次应用于抗菌药物与疫苗筛选的研究。项目组已进行的研究对于药物靶基因的筛选和底盘细胞的合成具有比较重要的指导意义,将在一定程度上促进抗菌与肿瘤治疗的药物设计、合成生物学中精简基因组的设计与底盘细胞构建这两个领域的发展。. 综上所述,本项目围绕微生物必需基因和联合基因识别展开了多方面的研究。在该项目的资助下,4年内发表标注资助的SCI论文13篇,其中1篇影响因子大于10,参与撰写著作一项。另外,获得软件著作权1项。研究计划执行顺利,全面完成了项目的研究目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

DOI:10.5846/stxb201912262800
发表时间:2020
5

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019

相似国自然基金

1

支原体的必需基因识别与核心基因组分析

批准号:11147182
批准年份:2011
负责人:林岩
学科分类:A25
资助金额:5.00
项目类别:专项基金项目
2

细菌基因组调控基元和必需基因的识别与分析

批准号:31271351
批准年份:2012
负责人:宋凯
学科分类:C0607
资助金额:80.00
项目类别:面上项目
3

基于多种人类致病菌必需基因的最小基因集构建及药靶基因效能定量评价模型研究

批准号:31660320
批准年份:2016
负责人:叶远浓
学科分类:C0608
资助金额:38.00
项目类别:地区科学基金项目
4

基于基因集富集分析的奶牛全基因组关联分析方法研究

批准号:31000992
批准年份:2010
负责人:王起山
学科分类:C1702
资助金额:20.00
项目类别:青年科学基金项目