Essential genes are indispensable for the survival of an organism under certain conditions, and their functions are therefore considered a foundation of life. Delineating a set of essential genomic elements and proteins that make up a living organism helps to understand critical cellular processes that sustain life. With the discovery of the CRISPR/Cas9 and rapidly falling cost of high-throughput sequencing technology, a majority of essential genes in different cancer cells are identified by experiments. In order to systematically research the biological characteristics of human essential genes, we will mainly concentrate on the data of human essential genes, mine the biological features of essential genes in eukaryotes based on the Database of Essential Genes, develop the prediction pipeline of essential genes with Z-curve method and try to characterize the evolution pattern of essential genes between human and other eukaryotes. Furthermore, we will also integrate the data of Isochores and replication origins to discover the distribution on chromosome and relationships with replication origins. The project will not only promote the understanding of the functional characteristics and evolutionary pattern for essential genes, but also provide new strategies and theoretical basis for cancer therapy in precision medicine.
必需基因是指生物细胞在特定条件下,维持生命基本生存及代谢所必不可少的基因,它们也被认为是构成生命活动的基础,探索生物必需编码基因和基因组元件是了解生命过程的重要途径之一。近些年随着基因编辑技术CRISPR/Cas9的问世,以及高通量测序成本的迅速降低,全基因组水平下大量人类癌细胞的必需基因被实验发现。为了能够系统研究人类必需基因的生物学特性,我们拟基于必需基因数据库中各类真核生物必需基因,以人类必需基因为主要研究对象,挖掘人类必需基因的生物学特征,融合Z曲线理论开发必需基因预测工具,同时系统刻画人类必需基因与其他真核生物必需基因的进化关系。此外,我们也将结合基因组Isochore结构及复制起始点数据,探索人类必需基因在染色体上分布及与复制起始点的相互联系。本课题研究能够加深对真核生物必需基因功能特征和进化机制的理解和认识,并在精准医疗领域为癌症的诊断和治疗提供新的研究思路和理论基础。
必需基因通常是指在特定条件下维持生物细胞正常生存代谢所必不可少的基因。过去几年随着基因编辑技术在不同人类细胞系中的广泛成功应用,人类基因组必需基因的识别有了重大发展。在本项目支持下,必需基因数据库DEG更新至版本15.0,并取得了重要的进展。相比于上一重要版本10.0,真核生物基因组必需基因增加四倍,原核生物基因组必需基因数量翻倍,尤其需要说明的是,人类基因组必需基因数量已增加至上一版的十倍以上。而且,这一版数据库还内置了分析模块,可以用于分析必需基因链偏差、亚细胞位置分布,以及GO和KEGG富集性分析。另外,还开发了人类基因组必需基因比较工具,可用于比较不同实验细胞系中的必需基因,结果可用韦恩图的形式进行可视化展示。基于该数据库,该项目还开展了原核基因组中必需基因与操纵子之间的关联研究。为了揭示操纵子中必需基因位置偏好的一般规律,定义了操纵子中的基因平均位置指数,用以分析51个细菌和2个古细菌基因组操纵子中的必需和非必需基因分布。研究结果发现必需基因优先占据操纵子的靠前位置,并可能倾向于以更高的水平表达。而且,通过对51个细菌的操纵子和必需基因进行链偏差研究,发现操纵子和必需基因都偏向位于前导链上,而且通过对不同基因数目和种类的操纵子进行对比分析,发现必需性和多基因这两个因素都会导致操纵子偏向于前导链,两者叠加偏向性更显著。此外,本项目还基于FLASK框架对真核生物复制起始点数据库DeOri进行重构升级,并完成了线上模型部署。项目负责人所维护的相关数据库中数据已经共享到国家基因组科学数据中心。该工作有助于我们更深一步理解基因组结构,并对合成生物学中的基因组设计奠定基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
新型树启发式搜索算法的机器人路径规划
智能煤矿建设路线与工程实践
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
基于自适应干扰估测器的协作机器人关节速度波动抑制方法
基于直观图的三支概念获取及属性特征分析
拟南芥花粉发育必需基因的克隆及功能分析
基于序列特征和统计判别方法发展细菌必需基因识别算法及软件
基于多种人类致病菌必需基因的最小基因集构建及药靶基因效能定量评价模型研究
多组学数据整合分析癌症细胞生存必需基因