基于植物胁迫响应基因表达数据和GO术语结合的特征选择及调控网络研究

基本信息
批准号:61472061
项目类别:面上项目
资助金额:80.00
负责人:孟军
学科分类:
依托单位:大连理工大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:栾雨时,张建英,陶小旖,张信,李锐,张静,石林,孙超,刘震
关键词:
基因调控网络基因表达数据特征选择GO术语
结项摘要

In the process of plant growth and development, the losses caused by various adversities and disease are countless. To seek the important resistant gene, grasp their regulatory mechanisms and use them are still our long-cherished wish. The development of high-throughput sequencing technology brings us more and more gene expression data. But the calculation and analysis of biological data lag far behind the amount of data growth. There are a lot of noise and redundant in the large amount of plant stress response gene expression data. This project will apply rough set theory to integrate gene expression data with GO terms and build neighborhood system based rough set model. To design attribute reduction algorithm based on heuristic information. First, we select significant elemental knowledge units and then select the significant genes. Then, classifiers are constructed according to the difference between individual gene information and propose a self-adapting ensemble classifier building strategy and a weight based basic classifier results fusion strategy in order to find the minimum gene subset with high classification performance. Last, we construct gene regulatory networks and verify the result by biology experiment. It will reveal the regulation relationship between the genes related to plant stress response. This project will lay the foundation for the efficient use of plant resistant gene.

植物在生长发育过程中,因各种逆境、病虫害造成的损失不计其数,探寻主要的抗性基因,掌握它们之间的调控机制并加以利用,一直是人们的夙愿。高通量测序技术的飞速发展,使得基因表达数据量与日俱增,但计算分析技术相对滞后,而且这些数据中存在大量的噪声和冗余。本项目拟根据粗糙集理论,针对植物胁迫响应基因表达数据,结合GO术语建立邻域系统粗糙集模型,设计基于启发式信息的属性约简算法,选择重要的基本知识单元,从中探寻关键基因;建立能体现个体差异的分类器,提出自适应的集成分类器构建策略,运用基于权重的基分类器结果融合方法,获得具有高分类性能的关键基因;构建基因调控网络,再通过生物学实验验证,揭示各基因之间的调控关系,为植物抗性基因资源的有效利用奠定基础。

项目摘要

高通量测序技术的发展产生了大量高维小样本生物数据,这为采用机器学习方法研究植物胁迫响应相关的重要基因提供了可能,而基因间的互作关系对植物的性状有很大的影响。.本项目研究了基因表达数据和GO术语的对应关系,从粒计算的角度给出基因本体知识的粒结构表示形式,构建结合GO术语的邻域粗糙集模型,充分考虑了生物知识,增强了基因选择结果的可解释性。.提出基于正域和相似度距离的基因选择方法,通过设计启发算子选择关键基因,为避免在基因初选过程中剔除掉一些对分类具有潜在价值的基因,提出了相交邻域粗糙集的矩阵计算方式和近似集并行计算方法来加快计算速度。.提出自适应的集成分类器构建策略,在三个拟南芥胁迫响应数据集上的实验结果表明提出的方法与常用方法比准确率提高4%。.提出了基于粗糙集理论的融合粒子群和遗传算法的调控网络构建方法,分析了基因及靶基因之间的调控关系,并采用qRT-PCR对番茄病菌胁迫响应基因进行了实验,验证了预测结果中大多数lncRNAs 和GRXs基因在病菌胁迫下上调表达。.上述研究结果揭示了一些重要基因对胁迫的响应,为基因组资源的有效利用和品种改良奠定了基础,也为采用机器学习方法研究基因数据提供了新的研究思路和理论依据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

相似国自然基金

1

基于GPU的基因表达谱数据特征选择策略研究

批准号:61702146
批准年份:2017
负责人:葛瑞泉
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目
2

棉花和拟南芥应答水分胁迫的转录组数据比较分析及基因表达调控网络的构建

批准号:31171276
批准年份:2011
负责人:苏震
学科分类:C0608
资助金额:60.00
项目类别:面上项目
3

整合基于GO的基因关联网络与基因共表达网络阐明植物复杂性状的分子遗传学基础

批准号:31071164
批准年份:2010
负责人:林魁
学科分类:C0609
资助金额:8.00
项目类别:面上项目
4

重金属胁迫下转基因植物的生理响应与抗虫基因表达特征研究

批准号:21147001
批准年份:2011
负责人:陈良燕
学科分类:B0607
资助金额:10.00
项目类别:专项基金项目