基于ChIP-seq数据和系统发生信息的调控模体预测

基本信息
批准号:61303084
项目类别:青年科学基金项目
资助金额:23.00
负责人:刘丙强
学科分类:
依托单位:山东大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:马勤,王振佳,周川,李阳,孙剑阳,袁晓辰
关键词:
系统发生足迹同源基因染色体免疫共沉淀测序数据融合调控模体
结项摘要

Transcription is the most essential step of gene expression, and transcriptional regulation is accomplished through transcription factors binding with the cis regulatory motifs, located on the upstream of corresponding genes. Therefore, the prediction of cis regulatory motifs is one of the most important computational problems in the field of bioinformatics. Recently, the rapid growth of genome sequencing data has provided a new opportunity in this field, and high-throughput chromatin immune-precipitation followed by the next generation sequencing (ChIP-seq) has promoted the problem to a genome scale. This project intends to predict the cis regulatory motifs utilizing ChIP-seq data along with phylogenetic footprinting information. In order to improve the performance of traditional motif prediction algorithms, we integrate the two kinds of information based on the complementary property of them. The key contributions of this project include that (i) convert the cis regulatory motif signals, embedded in phylogenetic footprinting and ChIP-seq, into conservative curve and coverage curve, respectively; (ii) enrich the phylogenetic footprinting pipeline based on the phylogenetic tree, operon structure and multiple sequence alignment; (iii) design a ChIP-seq data-processing framework to reduce the influence of background noises and experimental biases; (iv) motif prediction and further optimization based on above strategies. It can be anticipated that this method would generate the prediction result with improved accuracy from these two sources of data. Corresponding software and database service are also expected to be available online.

转录过程是基因表达的第一步,而转录调控通常是通过转录因子结合与基因上游的调控模体结合来实现的。所以调控模体预测一直是生物信息学中的重要课题。近年来,快速增长的基因组数据为研究调控模体提供了新机遇,而基于新一代测序的ChIP-seq技术将调控模体研究带入了全基因组水平。本项目拟结合ChIP-seq数据和系统发生足迹来预测调控模体。立足于两种数据的互补性,我们从各自的数据处理中的问题入手,重点解决数据融合问题,实现模体预测性能的提高。主要工作体现在:(1)将系统发生足迹和ChIP-seq的蕴含的调控模体信息分别转化为保守度曲线和覆盖度曲线,进行有效的数据融合。(2)利用系统发生树、操纵子、序列联配等信息解决系统发生足迹中的问题。(3)设计ChIP-seq数据处理的方法,减少噪音和实验偏差的影响。(4)基于融合数据进行模体预测和优化。最终实现异源数据的互补,提高预测精度,并提供软件及数据库服务。

项目摘要

基因的转录调控作是基因表达的第一步,通常通过转录因子结合与基因上游的调控模体结合来实现。所以调控模体(转录因子结合位点)的计算预测一直是生物信息学中的重要课题。近年来,快速增长的基因组数据为研究调控模体提供了新机遇,而基于新一代测序技术将调控模体研究带入了全基因组水平。本项目重点研究基于系统发生足迹和ChIP-seq数据和来进行调控模体预测的相关算法设计和平台构建。在此背景下,我们开发了一系列调控模体预测与分析的软件和平台。我们整合与模体预测相关的基因组序列数据,操纵子结构数据等,开发了模体预测与分析服务器DMINDA,用户可以直接利用模体预测工具包BoBro2.0的相关功能,进行de novo模体预测和分析,从而在全基因组的范围上进行调控模体预测。我们完成了基于系统发生足迹法的转录因子结合位点预测算法,命名为MP3(phylogenetic footprinting framework)。本算法实现了预期的设想,在原核生物同源基因选取、同源操纵子确定、同源调控序列构造、转录调控位点初选以及最终的模体剖面构造等方面取得了不错的效果。我们运用在大肠杆菌数据上进行交叉验证,验证了算法的有效性。另外,我们也将MP3算法整合到了DMINDA服务器上,结合前期整合进去的DOOR操纵子数据库,能够自动的生成同源的调控区域序列,非常便利的进行转录因子结合位点预测。基于在转录因子结合位点预测上的结果,我们设计一个新的共调控关系衡量算法,并进一步的设计了调节子构造算法,有助于构造转录调控网络的研究。调控网络是生命体中的最重要的关系网络,基于转录调控关系的调控网络构建一直是一个难题,我们基于前期模体预测和分析比对的基础,重点解决共调控关系构建过程中模体剖面精度问题、模体比对问题以及预测结果过大带来的基因聚类难题。构造了一个反映共调控关系的打分机制,并利用这个打分,设计了一个基于点分割的图算法,来构造转录调节子。调节子预测的方法也被整合在DMINDA服务器中,这些软件将会对基因的转录调控,特别是原核生物的转录调控研究提供很好的支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

近 40 年米兰绿洲农用地变化及其生态承载力研究

近 40 年米兰绿洲农用地变化及其生态承载力研究

DOI:
发表时间:2020

刘丙强的其他基金

批准号:61772313
批准年份:2017
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

Chip-seq数据的位点特异性模体识别算法研究与开发

批准号:31301087
批准年份:2013
负责人:余泓
学科分类:C0608
资助金额:22.00
项目类别:青年科学基金项目
2

基于新一代测序数据的顺式调控模体预测与分析

批准号:61772313
批准年份:2017
负责人:刘丙强
学科分类:F0213
资助金额:63.00
项目类别:面上项目
3

ChIP-Seq数据的从头模体发现与RNA-Seq短序的从头组装算法研究

批准号:61572358
批准年份:2015
负责人:张少强
学科分类:F0213
资助金额:63.00
项目类别:面上项目
4

多样本ChIP-Seq数据定量比较的生物信息工具开发

批准号:31701140
批准年份:2017
负责人:邵振
学科分类:C0609
资助金额:27.00
项目类别:青年科学基金项目