基于表观基因组与转录组数据的整合挖掘以及基因调控网络的动态解析构建棉花基因组结构与功能注释体系

基本信息
批准号:31571360
项目类别:面上项目
资助金额:60.00
负责人:苏震
学科分类:
依托单位:中国农业大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:易欣,张力圩,张康,尤琪,宋倩
关键词:
棉花基因调控网络数据挖掘转录组表观基因组
结项摘要

Cotton is one of the most economically important crops worldwide. With the release of whole genome sequence of both G. raimondii (D subgenome) and G. arboretum (A subgenome), it is more and more essential for cotton research community to refine the genome-wide annotation of genome structure and gene function. Currently, there are large amount of Gossypium omics data publically available, including genome and transcriptome data, but little epigenome data. Our preliminary ChIP-seq analysis results showed that, the ratios of the H3K4me3 distribution in coding region of G. arboretum genome have declined about nearly 20% compared to those of Arabidopsis and rice genome, indicating that there is a certain proportion of the cotton genes were not identified or predicted. In this study, we will apply epigenomic data to improve the cotton genome structure annotation and discover new coding and non-coding genes. In addition, due to the low proportion of annotated genes in cotton genome, we plan to use the accumulated transcriptomic data to develop whole genome-wide cotton gene co-expression network, further analyze the functional modules, and try to improve the cotton gene function annotation. Finally, we will build a platform of refined annotation for cotton genome structure and gene function, and setup a data mining system. Eventually, this platform will be beneficial to successfully discover the functional modules and key nodes with important agronomic traits of cotton to promote the study of cotton molecular breeding.

棉花是世界上最重要的经济作物之一,随着亚洲棉(A组)和雷蒙德氏棉(D组)的全基因组测序完成,对棉花基因组结构和功能的精细注释也越发迫切需要。目前公共平台已积累了大量组学数据,包括棉花基因组和转录组等数据,但表观基因组学数据鲜有累积。本课题组通过ChIP-seq实验初步发现,和拟南芥与水稻相比,棉花H3K4me3在基因区间的分布比例有近20%左右的下降,可以预测棉花基因组中还有一定比例的基因未被识别和注释。本项目将开展棉花表观基因组研究,促进棉花基因组结构注释以及发现新的编码和非编码基因。另外,棉花基因功能注释比例较少,我们利用棉花转录组数据构建共表达网络并分析基因功能模块,对棉花基因进行功能注释。最后,本项目将建立棉花基因组结构和功能注释以及数据挖掘体系,通过新基因位点发现、基因网络动态解析、基因功能富集分析等,挖掘棉花重要农艺性状相关的功能模块和关键节点,以期推进棉花分子育种的研究。

项目摘要

棉花是世界上重要的经济作物之一, 涉及农业和纺织工业两大重要的国民经济支柱产业。随着雷蒙德氏棉(D基因组)、亚洲棉(A基因组)、陆地棉(AD基因组)、海岛棉(AD基因组)等全基因组测序的陆续完成, 对棉花基因组结构和功能进行精细注释就越发迫切。在本项目执行期间,我们自行构建了标准分析流程,整合了棉花基因组、转录组、表观基因组学数据,包括公共平台的数据和自行绘制的亚洲棉和陆地棉苗期不同组织、不同处理条件下的转录组数据,组蛋白修饰的表观基因组数据, 并在此基础上先后构建了亚洲棉基因共表达网络、二倍体和多倍体棉花基因网络与功能模块比较分析平台等,结合构建的基因功能富集分析和数据可视化挖掘平台(agriGO ver2、PCSD、PlantEAR等),初步完成了一个棉花基因组功能注释与数据挖掘平台体系。我们依托这一体系,通过多维组学数据协同解析,在全基因组水平上预测了棉花(亚洲棉和陆地棉)新基因,包括编码基因、非编码基因、可变剪切等,并进行了共线性分析比较,在亚洲棉中共预测出了6773个新转录本,在陆地棉中预测出了12773个新转录本。同时,我们还在亚洲棉和陆地棉中分别挖掘出了1,155和1,884个共表达功能模块,并预测了213和135个miRNA靶基因功能模块。利用已构建的棉花基因调控与信号转导网络,对参与诸如代谢、病原体和胁迫应答、激素响应和生长发育等生物学过程的关键基因进行了模块化挖掘,还进行了部分实验验证。总而言之,我们采用多组学整合和模块化比较分析方法, 充分发挥了多组学整合分析的互补性和高效性, 实现了对棉花的基因组结构和功能基因的精细注释。我们期待这一工作能对棉花关键农艺性状相关的功能模块和关键基因研究提供新视角, 并为刚刚测序的多倍体植物/作物提供可行的功能基因组精细注释分析方案。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

苏震的其他基金

批准号:81671403
批准年份:2016
资助金额:52.00
项目类别:面上项目
批准号:31171276
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:30871179
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:31771467
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:31071125
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:31371291
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:30570139
批准年份:2005
资助金额:28.00
项目类别:面上项目
批准号:90817006
批准年份:2008
资助金额:60.00
项目类别:重大研究计划

相似国自然基金

1

植物表观基因组和转录组数据整合及其时序动态变化规律探索

批准号:31371291
批准年份:2013
负责人:苏震
学科分类:C0601
资助金额:70.00
项目类别:面上项目
2

棉花基因组结构与功能的比较基因组学研究

批准号:31371282
批准年份:2013
负责人:王希胤
学科分类:C0607
资助金额:70.00
项目类别:面上项目
3

水稻泛基因组图谱的基因注释、表达分析与数据库构建

批准号:31871268
批准年份:2018
负责人:赵强
学科分类:C0607
资助金额:60.00
项目类别:面上项目
4

整合基因组注释信息对西门塔尔牛生长性状的全基因组选择研究

批准号:31802049
批准年份:2018
负责人:朱波
学科分类:C1702
资助金额:26.00
项目类别:青年科学基金项目