高通量DNA甲基化测序数据的处理及功能基因组区域识别研究

基本信息
批准号:61203262
项目类别:青年科学基金项目
资助金额:27.00
负责人:苏建忠
学科分类:
依托单位:哈尔滨医科大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:王芳,崔颖,李伯言,严海丹,吴雪婷,赵国峰
关键词:
甲基化DNA下一代的测序技术甲基化模式数据标准化差异甲基化区域
结项摘要

DNA methylation is an important epigenetic modification that plays a vital role in regulation of transcription and chromatin activity, embryonic development, gene imprinting, maintenance of pluripotency and carcinogenesis. Combining next-generation sequencing technologies with pretreatment approaches of DNA methylation generates several accurate and high-throughput techniques for mapping DNA methylation feasible on a genome-wide scale. The process and analysis high-throughput DNA methylation data for identification of functional regions is urgent to solve an epigenetic problem. The project will develop the normalized algorithms to convert high-throughput DNA methylation data measured by various measuring technologies to methylation level of CpGs at single-base resolution. Furthermore, we develop a novel method to identify the functional regions with different methylation patterns based on the strategy of hotspot extension and the theory of information entropy. For multiple high-throughput methylation data genome-wide, we develop a mixed method by combining a combinational algorithm for the qualitative identification and variance analysis for quantitative evaluation to filter out the differentially or sample-specific methylated regions with statistical significance.Furthermore, we will develop a module to mine the sequence characteristic and functional annotation analysis. This project aims to develop a use-friendly platform for systematic analysis of high-throughput DNA methylation data, permitting further investigation of the epigenetic mechanism of genome-scale methylation patterns.

DNA甲基化是重要的表观遗传修饰之一,在调控基因表达、维持基因组稳定性、胚胎发育和癌症的发生等方面发挥着至关重要的作用。下一代测序技术与DNA的甲基化依赖的预处理方法结合形成多种DNA甲基化的检测技术,用于全基因组DNA甲基化数据检测,这些高通量DNA甲基化数据的处理和分析是当前表观遗传学研究领域中急需解决的问题。本项目将开发高通量DNA甲基化数据的标准化处理算法,把原始的测序数据转化成基因组范围内单碱基通量的CpG甲基化谱。基于热点扩增和信息熵理论,开发新算法来精确识别基因组范围内不同甲基化模式的功能区域;基于组合富集算法和方差分析算法,开发新算法筛选多个细胞或组织间统计学显著的差异或特异的甲基化区域,并对识别的功能区域进行序列特征挖掘和功能注释分析。本项目旨在开发处理和分析高通量DNA甲基化数据的系统平台,将成为挖掘和分析基因组范围内DNA甲基化模式及表观遗传调控机制的有效工具。

项目摘要

紊乱的DNA甲基化模式广泛发生在各种癌肿类型中,可逆的DNA甲基化已经成癌症治疗的潜在靶点。快速发展的新一代测序检测技术与重亚硫酸盐测序转换结合可以精确检测全基因组范围内单碱基水平的DNA甲基化谱。DNA甲基化谱的标准处理,储存和分析,及在大样本间差异DNA甲基化模式的识别方法对于研究DNA甲基化在癌症发生和发展中作用是至关重要的。本研究在国家自然基金青年项目“高通量DNA甲基化测序数据的处理及功能基因组区域识别研究”的资助下,开发了一个综合的处理高通量、大样本的DNA甲基化数据的分析平台(iBStools),包括DNA甲基化测序数据质量分析及甲基化水平评估, DNA甲基化模式识别,多样本差异甲基化区域识别和甲基化模式区域注释四个主要模块,用于在不同组织、细胞系及癌症类型间甲基化标记物识别。本项目基于Markov模型和信息熵开发了大样本间差异甲基化模式区域识别的新方法(CellMethy),用于识别癌症的特异甲基化模式,进一步应用于分类癌症类型及癌症子亚型。结合高通量的组蛋白修饰和单核苷酸多态数据,本项目利用随机森林模型发现在细胞系间DNA甲基化模式的改变与三种活性染色质修饰显著关系; 通过DNA甲基化和组蛋白特征基于Logistic 回归模型识别出新的长非编码RNA;基于最大似然模型发现了DNA甲基化结合单核苷酸多态对基因表达的协同调控作用。此外,开发了两个数据库(DevMouse和MetaImprint)用于数据储存、查询,Meta分析和可视化。总之,本项目开发了一个高效的DNA甲基化处理平台,从不同层面识别与DNA甲基化相关的生物学标记,挖掘与癌症相关的异常DNA甲基化特征,有助于探索DNA甲基化在癌症发生发展过程中表观调控作用及治疗的靶点。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022

苏建忠的其他基金

相似国自然基金

1

基于高通量测序数据多供体植物基因组结构变异识别方法研究

批准号:61402132
批准年份:2014
负责人:王春宇
学科分类:F0213
资助金额:24.00
项目类别:青年科学基金项目
2

基于高通量测序数据的启动子模式识别及调控功能研究

批准号:61601110
批准年份:2016
负责人:赵玉茗
学科分类:F0124
资助金额:21.00
项目类别:青年科学基金项目
3

基于高通量测序数据的isomiR功能研究

批准号:61105003
批准年份:2011
负责人:裴云飞
学科分类:F0304
资助金额:23.00
项目类别:青年科学基金项目
4

基于高通量测序数据研究基因组变异的统计问题

批准号:11471022
批准年份:2014
负责人:席瑞斌
学科分类:A0403
资助金额:60.00
项目类别:面上项目