It is the important basis for improving grain yield to analyze the genetic structure and regulation mechanism related to crop yield. Aiming at the key genes mining problems that affect the main characters, the project tries to develop the effective algorithms of genome-wide association studies (GWAS), and to study the genetic regulatory network model for data fusion from the point of view of bioinformatics. First of all, with the clustering method and the linkage disequilibrium (LD) characteristics, the tagSNP selecting algorithm is proposed based on graph model to provide the representative SNP site scale suitable for GWAS research. Then, for the epistasis detecting problem with the high complexity on a genome-wide scale in GWAS, we will study the detection method based on genetic algorithm for multiple SNP sites epistasis; and in the meantime, we propose a SNP domain knowledge representation method based on multi-threshold, to improve the detection performance of algorithm. Finally, the project tries to present the score function and learning algorithm of dynamic Bayesian network (DBN) structure to integrate multiple omics data so as to provide the reasonable model for genetic regulatory network analysis. The research is helpful for people to deeply understand the grain crop complex genetic structure and regulation mechanism of traits, and provide new information science method for the study of high yield breeding in China agriculture. Therefore, this project has important research significance and potential application value.
解析农作物产量性状相关的遗传构成和调控机制是提高粮食单产的重要基础,本项目从生物信息学角度,针对影响主要性状的关键基因发现问题,发展全基因组关联分析(GWAS)的有效算法,并研究面向多数据融合的遗传调控网络模型。首先,采用聚类方法,并根据连锁不均衡特性,建立基于图模型的tagSNP获取算法,为GWAS研究提供规模合适的代表性SNP位点。然后,针对GWAS在全基因组范围内检测上位效应计算量大的问题,提出基于遗传算法的多SNP位点上位效应检测方法;同时,拟提出基于多阈值的先验知识表示方法,利用SNP先验信息提高算法检测性能。最后,拟给出面向多种组学数据融合的动态贝叶斯网络结构评分函数和学习算法,为遗传调控网络解析提供合理的模型描述。本项目的研究有利于人们深入理解粮食作物复杂性状的遗传构成和调控机制,为我国农作物的高产育种研究提供新的信息学方法,因此,本项目具有重要的研究意义和潜在的应用价值。
农作物产量性状是影响粮食单产的重要方面,而全基因组关联分析(GWAS)是研究数量遗传的主要手段之一。该项目利用信息科学理论与方法,研究了GWAS的有效算法、关键基因发现、面向多数据融合的遗传调控网络构建方法。取得如下重要成果:.(1)在GWAS算法研究方面,提出了基于HMM和无参考数据集条件下高效、快速补缺算法;提出了基于稀疏分组lasso模型并融合种群校正的多位点关联分析SNP检测算法,充分考虑位点间相互作用;引入先验知识修改弹性网络惩罚方法,考虑了植物遗传学GWAS研究中种群分层和亲缘关系影响;提出基于置换梯度提升模型的上位检测算法,以检测微弱主效应;构建了基于eQTL的SNP功能注释数据库和功能富集GWAS分析平台。.(2)在挖掘目标性状关键基因方面,提出了单一时序表达谱数据中识别差异表达基因的方法,并提出了一种基于基因共表达信息排序筛选策略;针对植物中籽粒、花色等质量性状,提出基于置换xgboost的基因互作检测算法,性能更好;提出基于有监督多维度相关性分析的基因互作检测算法,对解释复杂性状的遗传机理具有重要作用。.(3)在遗传调控网络构建方面,定义了不同权值整合多种数据集;提出了基于互信息指导和断点检测策略的贝叶斯网络结构搜索算法,降低了复杂度;提出基于加性噪声模型的基因调控网络构建算法,效果提升明显;预测了水稻组织特异性网络,包括使用可靠性评分方法等,作为首个针对水稻组织特异基因和PPI的数据库,能够在未来水稻生长发育的调控机制研究中发挥作用,为研究水稻增产提供线索。.发表论文31篇,其中期刊论文26篇(包括国际刊物17篇)、会议论文5篇;SCI、EI、中文核心期刊分别收录16篇、10篇、5篇。结合本项目研究工作,培养博士生5人、硕士生9人。.本项目将对进一步研究GWAS算法和调控网络构建方法具有重要理论意义,为农作物产量性状的遗传网络解析研究提供信息科学方法和技术。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
监管的非对称性、盈余管理模式选择与证监会执法效率?
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
基于网络的全基因组关联分析方法
面向全基因组关联的复杂疾病遗传互作网络研究与分析
面向全基因组从遗传变异到复杂疾病关联网络模型构建研究
向日葵油脂组分的全基因组关联分析与基因网络构建