In this project, we are going to construct soybean genome-scale metabolic network based on genome annotation and template interolog mapping and analyze the kinetic properties of metabolic network based on complex network theory. Then, using the proposed soybean genome-scale metabolic network, we will evaluate and analyze its practicality. Our research is mainly focus on that: Firstly, metabolic network will be initialized by genome annotation, using web scraping and semi-supervised machine learning techniques to perform scientific documents mining and data fusion. Moreover, the basic metabolic network will be performed on soybean by template mapping with other species. At the same time, we will build up models of metabolic network with flux balance analysis and analyze their kinetic properties with complex network theory. With these theoretical certifications, the new models and algorithms could be more accurate and reasonable. In addition, several machine learning methods will be proposed to do further evaluation and modification. Based on the genome-scale metabolic network, we will make detailed practical analysis of soybean production, oil output and the content of nutrition on important sub-networks. This project is going to propose some novel models and algorithms about the modeling and detailed analysis of metabolic network. And we will tempt to construct and study genome scale metabolic networks for complicated species. It will construct the soybean genome-scale metabolic network for the first time and make great promotion and further improvement on the soybean industry. It will become the state of art example and provide useful experience for genetic engineering performed on other crops.
本项目拟采用功能注释和模板同源映射等方法构建大豆的全基因组规模代谢网络,基于复杂网络理论对代谢网络的动力学性质进行分析,并利用所构建的基因组规模代谢网络进行大豆的实用性分析。首先运用网络爬行和半监督机器学习文本挖掘技术进行文献挖掘和数据融合,采用基因组注释方法构建初始的代谢网络模板,并采用模板映射方法将其他物种代谢通路映射到大豆物种上。进一步采用流量平衡分析方法和复杂网络理论构造和剖析代谢网络的数学模型,使得模拟的结果更准确。最后采用机器学习方法对所构建的代谢网络进行评估与修正。还将利用所构建的全基因组规模代谢网络,对大豆的油料产出、营养物含量及产量等方面进行实用性分析。本项目将开发若干有关代谢网络建模与分析的新算法,并尝试复杂物种全基因组规模通路的构建与分析。提出了构建大豆全基因组层面的代谢网络图,将为大豆产业带来前瞻性和深远的影响,并为其它作物的基因工程提供指导性建议和参考范例。
从相关公共网站搜集了大量大豆相关的基因组数据和代谢组数据,同时研究数据去噪和标准化方法。通过借鉴“基于快速搜索和发现密度峰值的聚类算法”的思想,将其扩展到复杂网络社区发现问题中,我们提出了一种“基于密度峰值的重叠社区发现算法”。针对生物医学文本挖掘和网络分析,提出一种半监督的吸引子传播算法(SSAP),大大减小了计算量,并充分利用了已知信息。提出的重采样集成学习算法(REA)可以通用于不均衡数据的分类问题,对于多分类问题采用基分类器集成,可以有效地提高集成分类器算法的性能。基于开放阅读框的长度与覆盖率,以及开放阅读框中的多联碱基频率,提出了一个新的lncRNA识别算法,并开发可提供多物种支持、具有高效率、可多平台使用等优点的新工具。构建了基于RNA的triple-vector表示下的多尺度相似性结构比较的网络服务平台,主要包括三个功能模块:1)一种新型的RNA二级结构的可视化工具,2)RNA的结构突变分析,3)多RNA的结构比较,并基于RNATV-curve构建进化树。使用GEO数据库中GPL4592平台下大豆锈病相关的基因表达数据,对数据进行预处理,筛选差异表达基因并构造出了大豆基因网络图G,并用改进的SpeakEasy算法进行了社区划分。之后,用DAVID在线分析工具对社区划分结果进行了功能富集分析。分析出了锈病病菌影响大豆生长的机理和大豆在锈病环境下的一些应激反应。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于超图的基因组规模代谢网络比对方法研究
基因组尺度代谢网络自动重构及模块化的研究
基于Memetic多目标时变优化的全基因代谢网络重构算法研究
关于大豆氮磷协同高效的全基因组关联分析