Essential genes are indispensable for the survival of an organism under certain conditions, and their functions are therefore considered a foundation of life. Delineating a set of essential genomic elements and proteins that make up a living organism helps to understand critical cellular processes that sustain life. With the discovery of the CRISPR/Cas9 and rapidly falling cost of high-throughput sequencing technology, a majority of essential genes in different cancer cells are identified by experiments. In order to systematically research the biological characteristics of human essential genes, we will mainly concentrate on the data of human essential genes, mine the biological features of essential genes in eukaryotes based on the Database of Essential Genes, develop the prediction pipeline of essential genes with Z-curve method and try to characterize the evolution pattern of essential genes between human and other eukaryotes. Furthermore, we will also integrate the data of Isochores and replication origins to discover the distribution on chromosome and relationships with replication origins. The project will not only promote the understanding of the functional characteristics and evolutionary pattern for essential genes, but also provide new strategies and theoretical basis for cancer therapy in precision medicine.
必需基因是指生物细胞在特定条件下,维持生命基本生存及代谢所必不可少的基因,它们也被认为是构成生命活动的基础,探索生物必需编码基因和基因组元件是了解生命过程的重要途径之一。近些年随着基因编辑技术CRISPR/Cas9的问世,以及高通量测序成本的迅速降低,全基因组水平下大量人类癌细胞的必需基因被实验发现。为了能够系统研究人类必需基因的生物学特性,我们拟基于必需基因数据库中各类真核生物必需基因,以人类必需基因为主要研究对象,挖掘人类必需基因的生物学特征,融合Z曲线理论开发必需基因预测工具,同时系统刻画人类必需基因与其他真核生物必需基因的进化关系。此外,我们也将结合基因组Isochore结构及复制起始点数据,探索人类必需基因在染色体上分布及与复制起始点的相互联系。本课题研究能够加深对真核生物必需基因功能特征和进化机制的理解和认识,并在精准医疗领域为癌症的诊断和治疗提供新的研究思路和理论基础。
必需基因通常是指在特定条件下维持生物细胞正常生存代谢所必不可少的基因。过去几年随着基因编辑技术在不同人类细胞系中的广泛成功应用,人类基因组必需基因的识别有了重大发展。在本项目支持下,必需基因数据库DEG更新至版本15.0,并取得了重要的进展。相比于上一重要版本10.0,真核生物基因组必需基因增加四倍,原核生物基因组必需基因数量翻倍,尤其需要说明的是,人类基因组必需基因数量已增加至上一版的十倍以上。而且,这一版数据库还内置了分析模块,可以用于分析必需基因链偏差、亚细胞位置分布,以及GO和KEGG富集性分析。另外,还开发了人类基因组必需基因比较工具,可用于比较不同实验细胞系中的必需基因,结果可用韦恩图的形式进行可视化展示。基于该数据库,该项目还开展了原核基因组中必需基因与操纵子之间的关联研究。为了揭示操纵子中必需基因位置偏好的一般规律,定义了操纵子中的基因平均位置指数,用以分析51个细菌和2个古细菌基因组操纵子中的必需和非必需基因分布。研究结果发现必需基因优先占据操纵子的靠前位置,并可能倾向于以更高的水平表达。而且,通过对51个细菌的操纵子和必需基因进行链偏差研究,发现操纵子和必需基因都偏向位于前导链上,而且通过对不同基因数目和种类的操纵子进行对比分析,发现必需性和多基因这两个因素都会导致操纵子偏向于前导链,两者叠加偏向性更显著。此外,本项目还基于FLASK框架对真核生物复制起始点数据库DeOri进行重构升级,并完成了线上模型部署。项目负责人所维护的相关数据库中数据已经共享到国家基因组科学数据中心。该工作有助于我们更深一步理解基因组结构,并对合成生物学中的基因组设计奠定基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于SSVEP 直接脑控机器人方向和速度研究
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
拟南芥花粉发育必需基因的克隆及功能分析
基于序列特征和统计判别方法发展细菌必需基因识别算法及软件
基于多种人类致病菌必需基因的最小基因集构建及药靶基因效能定量评价模型研究
多组学数据整合分析癌症细胞生存必需基因