The early development of mammalian is strictly dependent on the temporal and spatial specificity and multi level modular co-regulation. By inferring the hierarchy and modular features of gene co-expression structure, we can greatly reduce the complexity for understanding the molecular mechanisms in embryogenesis. Different high-throughput omics data have been constantly emerged and promotes better understanding the molecular regulation of embryonic development by integrating multi-level data. This work is carried out in accordance with the database construction, regulatory module recognition, functional analysis. Based on the mRNA transcriptome, DNA methylation, DNA geometry flexibility in mammalian early development, we plan to build a multifunctional molecule information repository of multilevel co-regulatory species specificity which provides data query, visualization, and analysis. Next, the weighted co-expression network analysis and diversity measure theory are used to develop accurate algorithm and program for identifying regulatory module of sequential expression. Then a comprehensive genome-wide modular map will be established that shows multi-level spatial and temporal regulation. The development-associated regulatory modules and genes newly predicted in this project are helpful for deep elaborating the topology structure and mechanism of collaborative module for embryonic development, as well as for further elucidating the molecular mechanism of mammalian early embryogenesis and providing an important reference for improving the developmental potential of mammalian embryo.
哺乳动物早期胚胎发育过程具有严格的时空特异性,依赖多层次模块化协同调控。通过推断基因共表达调控结构层级化和模块化功能特点,能够极大降低理解胚胎发育分子机制的复杂度。不同高通量组学数据的涌现迫切需要整合多层次组学数据研究哺乳动物早期胚胎发育程序化分子调控机理。本项目依照数据库构建,模块建模识别,功能分析等研究思路,基于哺乳动物早期胚胎发育基因转录组mRNA表达、DNA甲基化、DNA几何结构柔性等数据,构建集数据查询与可视化分析为一体的哺乳动物物种特异性早期胚胎发育多层次协同调控分子信息库,基于加权基因共表达网络和离散增量理论开发精确高效的物种特异性基因时序表达模块识别算法和模型,并绘制较全面的以模块为基础的全基因组范围内具有严格程序性时空调控的多层次协同调控模式图谱,有助于深入阐明发育过程协同调控模块的拓扑结构及作用机理,为进一步揭示哺乳动物早期胚胎发育的分子机理和提高胚胎发育潜能提供依据。
哺乳动物早期胚胎发育具有严格的时序性激活特点和多层次调控复杂性。本项目研究计划主要是通过整合各类高通量组学实验数据,绘制全面的以模块为基础的多层次协同调控模式图谱,筛选胚胎发育相关功能基因模块。我们严格按照项目计划书开展本项目的研究内容,项目成员勤奋积极,技术路线合理正确,研究执行顺利,在本项目的资助下,我们在哺乳动物早期胚胎发育的生物信息学研究领域取得系列突破性的成果,截至目前,发表标注本项目的科研成果13篇论文,其中SCI收录论文12篇,先后入选ESI 1%高被引论文2篇,国际同行引用评价较好,主要内容包括:建立了国际上首个哺乳动物多物种特异性早期胚胎发育基因时序性表达数据库,开发了了胚胎发育时空特异性人工智能预测平台,获批2项具有应用价值转化的软件著作权; 建立了早期胚胎发育细胞编程合子基因组激活的物种特异性差异基因分析方法,完成了关于草原家畜哺乳动物植入前胚胎发育全基因组激活的物种特异性差异基因识别的方法;基于多视图双聚类方法系统分析不同哺乳动物早期胚胎发育基因激活差异,阐述了早期胚胎发育过程中全基因组子区域精细化的DNA甲基化变化,绘制出子区域的DNA甲基化动态变化图;阐述序列模体组合决定TET蛋白功能发挥的序列特征与功能基础;建立基于蛋白质氨基酸约化分类的序列特征可视化分析服务平台,平台国际生物信息权威软件库OMICTOOLS收录(收录编号:OMICS_08205),并给予5星推荐指数,目前已成为国际权威蛋白质氨基酸序列分析的重要工具之一。本项目完成的科研成果对于深入阐明发育过程协同调控模块的拓扑结构及作用机理具有很重要的理论参考意义,为进一步揭示哺乳动物早期胚胎发育的分子机理和提高胚胎发育潜能提供重要的数据知识价值,项目的理论成果对于再生医学,改善人类辅助生殖技术、促进优生均具有重要的理论帮助。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于多组学数据的体细胞重编程核心调控模块识别及功能分析
整合分析组学数据、寻找前列腺癌相关的microRNA调控模块
哺乳动物早期胚胎发育的核质关系
基于单细胞组学数据研究早期胚胎发育中表观遗传模式的建立