基于新一代测序数据的顺式调控模体预测与分析

基本信息
批准号:61772313
项目类别:面上项目
资助金额:63.00
负责人:刘丙强
学科分类:
依托单位:山东大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:马勤,梁成,李阳,于婷,刘翔宇,邢飞,韩玲,袁媛
关键词:
计算生物学顺式调控模体新一代测序数据转录调控网络组合优化算法
结项摘要

Identification and analyses of cis-regulatory motifs represent an important problem in computational biology, and it provides a key piece of information for inference of transcriptional regulatory networks encoded in a cell. Here we propose a comprehensive study on accurate predication and systematic analysis of cis-regulatory motifs in human genome, based on large-scale ChIP-seq date sets in public domain. First, we will design a novel motif prediction method on the TF binding regions provided by a given ChIP-seq data set, aiming to improve both the state-of-the-art accuracy and efficiency. This method organically integrates hash table technique, graph theory and combinatorial optimization, etc. Specifically, it transforms the challenging motif length identification problem into a maximal weighted path problem on a de bruijn graph model; and it enables co-factor and discriminative motif finding, leading to a new co-factor motif module prediction function. Second, the read depth information of binding activity will be used to reduce the bias caused by the random proportion of motif segments in existing motif representing model, the purpose of which is to improve the performance of motif searching and comparing algorithms. Third, we will develop a new framework for transcriptional regulatory network construction and analysis, based on the knowledge and insights gained from the last two studies and large-scale TF binding data in public domain. Finally, an integrated software system for all the above studies will be developed and implemented on a web-based server, aiming to facilitate more researchers with limited computational background. We believe that the proposed studies will intrinsically improve the performance of ChIP-seq based motif finding and enhance the analysis and application of cis-regulatory motifs. The new insights gained and new computational technology developed in this project, will enable a large community of biology researchers to conduct a broad range of data analysis studies that are currently not feasible.

顺式调控模体的预测和分析是计算生物学中的重要问题,是研究生命体内调控机制的关键。本项目利用ChIP-seq技术提供的转录因子结合区域来准确预测和系统分析人类基因组中的顺式调控模体。项目针对人类ChIP-seq数据规模较大带来的计算困难,结合哈希表、图论和组合优化技术设计模体预测算法,兼顾了效率和准确度的提高;同时,引入德布鲁因图技术解决模体长度确定难题,并将共因子模体、区别性模体预测等重要应用功能有机的融合在算法中实现。项目利用测序短序列覆盖深度信息,改进模体表示模型,进而提高模体搜索和比对等模体分析算法的精度。项目基于大规模转录因子数据,通过模体预测与分析,探索转录调控网络构建方法并利用图模型进行调控网络模块分析,最终形成一套顺式调控模体的高效预测和系统分析的软件系统,并实现网络在线服务。本项目的完成将大幅提高调控模体的预测效果,实现调控模体的深层次分析,促进转录调控机制研究。

项目摘要

顺式调控模体的预测和分析是计算生物学中的重要问题,是研究生命体内调控机制的关键。该项目充分利用新一代测序数据研究人类基因组中模体预测的新算法和分析应用新方法,通过引入新的理论、技术和计算模型解决计算瓶颈和存在的问题,提高模体预测精度和效率,开发相应的软件并提供在线网络服务;进而,在此基础上综合大规模ChIP-seq以及表达数据进行调控分析,增加了相关数据的可解释性,促进转录调控领域的研究发展。项目同时研究了人类基因组以及与人类复杂疾病具有复杂关联关系的微生物组,包括在微生物的基因组结构,转录调控单元等方面。主要的成果包括设计了DESSO、CEMIG、WTSA、seqATU等系列模体预测、转录单元预测算法、lncRNA-gene调控网络预测算法,对基于ChIP-seq进行模体预测算法DESSO开发了网络服务器,发表SCI收录论文8篇,包括生物信息学顶级和主流期刊Nucleic Acids Research(IF16.971)、Briefings in Bioinformatics(IF11.622)、Bioinformatics(IF 6.937)等,毕业博士硕士研究生4名。本项目的完成将大幅提高调控模体的预测效果,实现调控模体的深层次分析,促进转录调控机制研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
5

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:

刘丙强的其他基金

批准号:61303084
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

真菌顺式调控模体与模块的全基因组范围计算预测

批准号:61103073
批准年份:2011
负责人:张少强
学科分类:F0213
资助金额:22.00
项目类别:青年科学基金项目
2

基于新一代测序数据的肿瘤纯度及倍体动态预测方法研究

批准号:61571341
批准年份:2015
负责人:袁细国
学科分类:F0124
资助金额:60.00
项目类别:面上项目
3

基于ChIP-seq数据和系统发生信息的调控模体预测

批准号:61303084
批准年份:2013
负责人:刘丙强
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
4

基于新一代肿瘤测序数据的驱动通路发现与综合分析方法研究

批准号:61472467
批准年份:2014
负责人:王树林
学科分类:F0213
资助金额:62.00
项目类别:面上项目