According to the fast growth of the DNA methylation and histone modification data and the urgent need of analyzing and mining these data in order to understand their biological meaning included in these data, we planned to build some sub-data of the DNA methylation and histone modification which are associated with cancer. By combing the latest programs for aligning High-throughput sequencing reads to a reference genome, the distribution density difference of these epigenomic modification in genome between normal cell and cancer cell will be analyzed. In addition, the sub-data for DNA methylation and histone modification as well as the relevant gene expression level will be built. The relations of the gene expression level with DNA methylation and different histone modifications in different functional regions will be studied. In order to find the biological meaning and the relationships of epigenomics modification with cancer occurrence, the relations of their combination patterns with cancer and gene expression level will be studied. Based on the diversity measure theory and expanding position weight matrix, the novel theory and algorithm for predicting gene expression level will be proposed by using the characteristic parameters of DNA methylation and histone modification combined with DNA sequence and structure information. It will be useful for the relative experiment research and applied research. It will be also helpful for understanding biological meaning of the DNA methylations and histone modifications.
针对DNA甲基化、组蛋白修饰数据的快速增长和对这些修饰数据所包含的生物学意义进行分析和挖掘的迫切需要,本项目拟建立与肿瘤相关的DNA甲基化、组蛋白修饰数据子库,结合最新的高通量数据分析算法,分析与癌症相关的DNA甲基化和组蛋白修饰在基因组上的分布和强度,比较它们与正常组织表观遗传修饰的区别。建立相关基因表达水平与不同组蛋白修饰和DNA甲基化的数据子库,分析基因不同功能区域的各种组蛋白修饰和DNA甲基化与基因表达水平的关系,特别是不同组蛋白修饰的组合模式与基因表达水平和癌症发生的关系,发现表观遗传修饰与癌症发生的联系和生物学意义。利用DNA甲基化和组蛋白修饰特征结合DNA序列信息与局域结构信息,在离散增量理论和推广的位置关联矩阵算法的基础上,进一步发展预测基因表达水平的新理论方法,为基础实验研究和应用研究提供理论指导和参考,为更好地理解DNA甲基化和组蛋白修饰的生物学意义提供帮助。
最近许多研究已经发现癌症的发生与表观遗传修饰密切相关,由于表观遗传修饰是可逆的,因此治疗由于表观遗传修饰导致的癌症将是可行的。DNA甲基化和组蛋白修饰是最重要的两种表观遗传修饰,本项目构建了人类乳腺癌和肺癌DNA甲基化和基因表达的数据子库,也构建了乳腺癌、肝癌和血癌组蛋白修饰、转录因子结合和基因表达数据库,研究了DNA甲基化、组蛋白修饰和转录因子结合与基因表达的关系,研究了不同表达水平基因中,不同组蛋白修饰之间的相关性和不同区域之间组蛋白修饰的相关性。提出了基于组蛋白修饰和转录因子结合及序列特征预测基因表达水平的算法,获得较好的预测结果。讨论了基因表达水平与DNA甲基化分布、组蛋白修饰分布和转录因子结合分布的关系。计算分析比较了正常组织(或细胞)与癌组织(或细胞)中差异表达基因、差异DNA甲基化、差异组蛋白修饰和转录因子结合,分析讨论了差异表达基因与相关癌症发生的关系,研究了引起这些基因表达水平变化的表观遗传修饰。发现了一些与癌症发生可能相关的重要基因以及导致这些基因表达水平改变的重要表观遗传修饰及其它们的关键修饰区域。研究了在正常组织(或细胞)与癌组织(或细胞)中差异表达的癌基因和抑癌基因,特别是发现了正常细胞中高表达和癌细胞中低表达的抑癌基因以及癌细胞中高表达和正常细胞中低表达的癌基因和导致这些基因差异表达的DNA甲基化区域或组蛋白修饰分布和重要区域。这些结果对于研究由于异常DNA甲基化和异常组蛋白修饰引起的癌症具有重要意义,也可为在转录组水平发现与癌症发生相关的重要基因及其关键表观遗传修饰生物标志物提供参考,由于这些表观遗传修饰的可逆性,这些结果可为相关癌症的进一步诊疗提供帮助。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
砷、硒调制DNA甲基化及组蛋白修饰的分析化学研究
组蛋白修饰与基因表达调控的相关性分析
吸烟致肺细胞癌变过程中凋亡逃逸相关DNA甲基化和组蛋白修饰变化
神经元细胞组蛋白及DNA甲基化的动态修饰研究