Experiments and bioinformatics analysis showed that the transcription, splicing and gene expression constitute a complex system affected by various factors. The histone modifications is closely related to the regulation process of gene expression and splicing. Currently, the next-generation sequencing coupled with chromatin immunoprecipitation (ChIP-seq) and high-throughput RNA sequencing are becoming key experimental approaches in the study of gene expression. Due to the histone modifications data generated from ChIP-seq, the RNA-seq data, genome and proteome, we aimed to develop a novel computational biology method to integrate and interpret such heterogeneous data sets. We also aimed to reveal the plausible associations of various biological processes or biological elements by analyzing the overwhelming amount of heterogeneous data from different experimental procedure. Based on Statistical analysis, signal pattern recognition and the latest machine learning technology, a theoretical model will be built to analyze the relative abundance and distributes characteristic of histone marks in functional regions such as gene body, promoter, splicing site,to investigate the regulation mechanism between the activation or inhibition of gene expression and various histone modifications. To get a better understanding the potential interplay of histone modifications, we will analyze its associations with gene expression, RNA splicing and alternative splicing, sequence characteristic, transcription and splicing factors, and so on. By testing the models in different cell types and species, we expect to get the origin and the conservative of the interaction models
大量的实验和信息学分析结果表明,基因的转录、剪接和表达是一个由多因素共同作用的复杂系统,组蛋白修饰与基因的表达调控和剪接过程有着密切的联系。基于新一代测序技术所产生的高通量的组蛋白修饰的ChIP-seq数据、基因表达的RNA-seq数据、基因组、蛋白质组等数据,开发新的异种数据整合算法,挖掘这些来自不同实验方法的异质的海量数据中所蕴涵的不同生物学过程或者生物元素之间的潜在联系。利用统计分析、信号识别以及最新的机器学习理论,建立理论模型,分析基因区域、启动子、剪接位点等功能区域的组蛋白修饰的相对丰度和分布特征,寻找各种组蛋白修饰协同调控基因的激活或抑制的机制,分析组蛋白修饰与基因表达、剪接及可变剪接、DNA序列特征、以及转录因子、剪接因子等调控元素间的相互关联,研究这种相互作用模式的起源和保守性。
基因的表达和剪接是一个由多因素共同作用的复杂系统。组蛋白修饰、转录因子结合、DNA甲基化等在基因的表达和剪接过程中发挥着重要的调控作用。这些调控因子往往共定位在基因组的启动子、增强子等调控元件上,精确地调控着靶基因在不同的组织细胞,不同的发育阶段,甚至不同的疾病中特异性的表达。同时,ENCODE计划的顺利实施提供了丰富的全基因组范围内的蛋白质与DNA相互作用,转录组丰度和单碱基精度的DNA甲基化数据,使得系统而定量的研究组蛋白修饰、转录因子结合、DNA甲基化调控基因表达成为可能。首先,利用GM12878和K562细胞系中的转录因子和组蛋白修饰的ChIP-seq数据,系统地分析了转录因子、组蛋白修饰间的共定位特征,深入研究它们之间可能存在的相互作用及其在不同细胞系间的动态变化特征。进一步,结合RNA-seq数据,通过构建高低表达基因集合,利用支持向量机和卷积神经网络等机器学习方法,预测了基因的表达水平,从而探索转录因子、组蛋白修饰及其相互作用模式对基因表达的影响。其次,利用GM12878和K562细胞系的RNA-seq数据,构建了可变剪接数据库,统计分析了组蛋白修饰与可变剪接模式的关联以及细胞系特异性,研究了组蛋白修饰在基因可变剪接过程中的调控作用。然后,利用基因注释信息,以及9种细胞系和15种组织DNA甲基化的Bisulfite-Seq数据,分析了启动子,外显子,内含子等功能区域的甲基化水平分布特征及其甲基化位点的序列特征,能够更好的理解DNA甲基化在不同的生物学过程中的功能。最后,利用鸟类基因组数据,构建了47中鸟类的进化树,提出了经典和量子进化方程研究鸟类基因组的进化,为定量研究鸟类和其他物种的进化问题提供了一种普遍的方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
组蛋白修饰与基因转录调控研究
食管鳞癌中组蛋白修饰状态及其对基因表达的调控作用
组蛋白乙酰化修饰调控SOD1基因表达在年龄相关性白内障发病中的作用机制及干预研究
恒河猴与人类大脑衰老过程中组蛋白修饰对基因表达调控网络的发现与比较