Chip-seq数据的位点特异性模体识别算法研究与开发

基本信息
批准号:31301087
项目类别:青年科学基金项目
资助金额:22.00
负责人:余泓
学科分类:
依托单位:中国科学院遗传与发育生物学研究所
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:袁运动,路则府,张宁,于超计
关键词:
大规模测序染色质免疫沉淀位点特异性模体识别
结项摘要

Transcription factors are crucial components for gene regulation. They control the downstream gene expression by interacting with specific DNA elements. With the development of sequencing technologies, ChIP-seq has become one of the most important strategies to investigate the relationship between transcription factors and DNA binding sites. Therefore, how to analyze ChIP-seq data and to identify the specific DNA elements have become one important scientific question. Several motif search algorithms have been developed and applied to identify the specific DNA elements in ChIP-seq data, however, current methods have a few drawbacks, including slow, relying on repeat masking and difficulties in distinguishing real binding sites. Here we propose to develop new motif search algorithms based on na?ve Bayes classifier, maximum likelihood and boosting algorithm and by digging and summarizing the special characteristics of ChIP-seq data. The new algorithm will overcome the drawbacks of old algorithms and will be more efficient for identifying specific targets of transcription factors. Our results will greatly improve the performance of motif search algorihtms on ChIP-seq data and will provide an important tool for studying transcription factors.

转录因子作为一种重要的转录调控因子,通过与特异的DNA序列结合,调控下游基因的表达。随着测序技术的发展,ChIP-seq已经成为研究转录因子和DNA结合关系的重要实验手段。如何分析ChIP-seq数据,确定转录因子的特异识别序列,寻找转录因子的特异调控基因,对于理解转录因子的功能具有重要科学意义。现在用于寻找ChIP-seq中的转录因子特异识别序列的模体识别算法存在计算速度缓慢、依赖重复序列过滤、无法区分识别位点真伪等缺点。本项目拟在已发表的ChIP-seq数据基础上,挖掘和总结ChIP-seq数据的特点,针对这些特点,利用朴素贝叶斯分类器、最大似然法和boosting算法,开发新的模体识别算法,从而改善目前算法存在的缺点,大大提高算法对ChIP-seq数据分析的针对性和整体性能。这些研究结果,将全面提高ChIP-seq数据模体识别算法的性能,对转录因子的研究提供新的技术手段和重要工具。

项目摘要

转录因子作为一种重要的转录调控因子,通过与特异的DNA序列结合,调控下游基因的表达。随着测序技术的发展,ChIP-seq已经成为研究转录因子和DNA结合关系的重要实验手段。如何分析ChIP-seq数据,确定转录因子的特异识别序列,寻找转录因子的特异调控基因,对于理解转录因子的功能具有重要科学意义。现在用于寻找ChIP-seq中的转录因子特异识别序列的模体识别算法存在计算速度缓慢、依赖重复序列过滤、无法区分识别位点真伪等缺点。本项目在已发表的ChIP-seq数据基础上,通过挖掘和总结ChIP-seq数据的特点,利用朴素贝叶斯分类器、最大似然法和boosting算法,开发出来新的模体识别算法,从而改善大大提高了新算法对ChIP-seq数据分析的针对性和整体性能。这些研究结果,将全面提高ChIP-seq数据模体识别算法的性能,对转录因子的研究提供新的技术手段和重要工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

氯盐环境下钢筋混凝土梁的黏结试验研究

氯盐环境下钢筋混凝土梁的黏结试验研究

DOI:10.3969/j.issn.1001-8360.2019.08.011
发表时间:2019
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

相似国自然基金

1

ChIP-Seq数据的从头模体发现与RNA-Seq短序的从头组装算法研究

批准号:61572358
批准年份:2015
负责人:张少强
学科分类:F0213
资助金额:63.00
项目类别:面上项目
2

基于ChIP-seq数据和系统发生信息的调控模体预测

批准号:61303084
批准年份:2013
负责人:刘丙强
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
3

基于CHIP-SEQ数据的microRNA启动子区域预测及转录因子结合位点分析

批准号:60901075
批准年份:2009
负责人:汪国华
学科分类:F0124
资助金额:20.00
项目类别:青年科学基金项目
4

多样本ChIP-Seq数据定量比较的生物信息工具开发

批准号:31701140
批准年份:2017
负责人:邵振
学科分类:C0609
资助金额:27.00
项目类别:青年科学基金项目