Histones are fundamental packaging elements of eukaryotic chromatin, which are wrapped by DNA sequence to form basic units of chromatin. Histone proteins are subject to a variety of covalent modifications that are recognized to govern the structure and function of chromatin. Different kinds of histone modifications usually work combinatorially to regulate many important biological processes, such as gene transcription, DNA repair, recombination, and so on. Yet, there is little known about patterns and functions of histone modifications. Recently, the second generation sequencing technologies have provided an opportunity for systematic analysis of histone modifications on a genome-wide scale. This project is proposed to investigate the patterns of histone modifications and how these patterns regulate gene transcription across different cell types, developmental processes, biological conditions and diseases. The discovery and characterization of such histone modification patterns can provide valuable information with respect to the activity of cell type and developmentally specific genomic regulatory features.
组蛋白是染色质主要成分之一,基因组的大部分DNA序列缠绕在组蛋白八聚体上形成染色质的基本结构。组蛋白的尾端可发生多种共价修饰导致染色质构型发生改变,进而影响基因表达调控、DNA 复制以及DNA修复等基本生命过程。基因组上组蛋白修饰具有特定的模式,发现组蛋白修饰的模式及探索其功能是一项具有重要学术价值的挑战性课题。随着新一代测序技术的发展,不同生物、不同细胞类型或不同状态下的组蛋白修饰图谱被测定并公布,为探究组蛋白修饰的模式及功能提供了数据支撑。本课题旨在集成现有大规模的组蛋白修饰数据,提出高效的数据挖掘方法,发现组蛋白修饰的模式及探索其在基因转录调控方面的功能。具体地,将研究组蛋白修饰的特异模式和基于组蛋白修饰特征的功能位点预测模型,不同类型组蛋白修饰的组合模式和因果关联性,不同条件下组蛋白修饰的动态变化模式,以及组蛋白修饰在基因转录调控中的功能。
新一代高通量测序技术的出现为采用计算方法探索组蛋白修饰提供了数据支撑,针对组蛋白修饰的模式发现和转录调控功能研究已经在国内外学术界外掀起一股研究热潮。本项目在以上生物信息学研究的背景下,集成现有大规模的组蛋白修饰和基因表达数据,采用高效的数据挖掘方法发现组蛋白修饰的模式及探索其在基因转录调控方面的功能。具体地,项目提出了一套组蛋白修饰模式发现与转录调控功能分析的理论体系,包括基于时空聚类的组蛋白修饰动态模式发现算法,基于多尺度小波变换的峰值检测和DNA结构化信息的组蛋白结合位置预测算法、基于多类序列特征的组蛋白结合位置预测集成分析算法,基于条件随机场的转录调控元件和模块识别方法等。这些理论研究成果丰富了表观遗传修饰研究中组蛋白修饰模式与转录调控研究方向的理论基础,为国内外研究者提供了一个组蛋白修饰模式发现与定位、数据挖掘与可视化分析的新模式。在此基础上,项目组提出了一个组蛋白修饰集成数据库实现方案,实现了一个包含大量组蛋白修饰数据、基因表达数据和基因组注释数据的集成数据库。进而,项目组设计和研发了一套组蛋白修饰模式发现数据分析软件平台,实现了组蛋白修饰数据的查询、挖掘分析与可视化。该集成数据库将为我国科研院所和生物信息企业提供多层次、全方位、高效的组蛋白修饰数据管理平台;开发和集成的多种组蛋白修饰数据的统计、分析和数据挖掘工具,将为组蛋白修饰模式发现与转录调控功能研究提供数据分析平台,在未来具有潜在的广泛的应用前景,能够产生良好的社会效益和经济效益。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
转录组与代谢联合解析红花槭叶片中青素苷变化机制
多数据库挖掘的模式发现系统群
基于ChIP-seq数据系统地挖掘具有生物学意义的转录因子和组蛋白修饰的特定组合
组蛋白修饰与基因转录调控研究
基于数据挖掘的用户网上行为模式的发现技术与应用研究