基于卷积神经网络的基因组选择方法研究

基本信息
批准号:31702110
项目类别:青年科学基金项目
资助金额:25.00
负责人:李东锋
学科分类:
依托单位:南京农业大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:魏巨龙,田亮,张琨,路海洋,李铭
关键词:
基因组估计育种值剩余采食量卷积神经网络
结项摘要

The development of animal breeding techniques and theories poses new challenges to the existing individual genetic assessment models. We conduct a genome selection study based on the development and optimization of the "Convolution Neural Network" (CNN) model and the genomic breeding value estimation of residual feed intake (RFI). The algorithm we developed can overcome the shortcomings of the traditional model to deal with large data, non - additive genetic effect analytic ability and the of poor model adaptability and inability to evolve. Based on this framework, the convolution neural network model (CNN I and CNN II) for traditional breeding value and genome breeding value estimation is constructed by optimizing the algorithm structure and parameters through a large amount of simulation data. A Hybrid paternal strain of silkie population are used in this study. The high-density SNP markers were obtained by the Reduced-Representation Genome Sequencing of the core breeding group, and the effects of AI-REML, GBLUP and CNN I, II were evaluated. The model is finally deployed to the server, with the continuation of the breeding process to automatically learn and refine itself. This work is an extension of the classical quantitative genetic approach, but also a little exploration of intelligent breeding, the results will play a role in promoting breeding efficiency.

育种技术和理论的发展对现有个体遗传评定模型提出了新的挑战。本研究以机器深度学习——“卷积神经网络”模型的开发和优化为出发点,以剩余采食量为突破口,进行基因组选择方面的研究,以克服传统模型难于应对大数据、非加性遗传效应解析能力不足和模型适应性差,无法进化的缺点。基于该框架,通过大量的模拟数据,对算法结构和参数进行探索优化,构建针对传统育种值和基因组育种值估计的卷积神经网络(CNN I和CNN II)模型。并借助育种企业高饲料报酬品系的选育过程构建验证群体,利用简化基因组测序方法对改良型乌骨鸡专门化品系父系核心群公鸡(600只)进行测序,获取高密度SNP标记,评估AI-REML、GBLUP和CNN I、II等算法实际效果。模型最终部署至服务器,随选育进程的持续推进不断自主学习。本研究是经典数量遗传学方法的延伸,也是对智能化育种的一点探索,其结果将对提升育种效率起到促进作用。

项目摘要

为应对规模化育种和大数据对现有个体遗传评定模型的挑战,本研究将机器深度学习算法——“卷积神经网络”模型引入个体育种值估计工作中。通过大量模拟数据训练和优化模型,最终分别构建出适合传统个体遗传评估模型。利用雪山草鸡构建验证群体,制定相应的选配方案,并评估模型实际应用效果,最终将模型部署至服务器。.基于该框架,通过大量的模拟数据,对算法结构和参数进行探索优化,构建针对传统育种值和基因组育种值估计的卷积神经网络(CNN I和CNN II)模型。研究发现基于系谱数据,基于单隐含层结构的神经网络模型并不比混合模型线性方程具有更多的优势,其对计算资源消耗反而更高。基于基因组数据构建的亲缘关系矩阵,该神经网络模型比混合线性模型具有明显的优势。神经网络模型更适应于基因组选择情景的应用。.配套智能育种软件可实现数据模拟功能、数据清洗、育种值估计及选育方案评估功能,提升育种效率,加快选育遗传进展。.为了对模型数据进行充分挖掘,利用线性混合模型对1600只雪山草鸡母鸡开产日龄(AFE),开产至60周龄的合格蛋数(QE)和开产至60周龄的总蛋数(EN)进行了全基因组关联分析(GWAS)。研究发现基于系谱和基于SNP的遗传参数估计表明,AFE、QE和EN均表现为中等遗传力性状(0.11~0.14),AFE与QE和EN均表现为较低的负遗传相关。针对三个性状的单变量GWAS分析显示,位于GGA1、GGA3、GGA8和GGA11上的16个候选SNP与其产蛋性状相关,这些SNP解释了1.29~3.12%的表型变异。通过注释16个全基因组范围内相关的SNP位点,鉴定出PED3A、SLC30A7、LRX3和LRX5可以作为产蛋性状的候选基因,RT-PCR也验证出一致的结果。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
3

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
4

不确定失效阈值影响下考虑设备剩余寿命预测信息的最优替换策略

不确定失效阈值影响下考虑设备剩余寿命预测信息的最优替换策略

DOI:10.11887/j.cn.202101019
发表时间:2021
5

采煤工作面"爆注"一体化防突理论与技术

采煤工作面"爆注"一体化防突理论与技术

DOI:10.13247/j.cnki.jcumt.001297
发表时间:2021

李东锋的其他基金

相似国自然基金

1

基于卷积神经网络+递归神经网络的物体关键点定位方法研究

批准号:61602530
批准年份:2016
负责人:赖韩江
学科分类:F0210
资助金额:21.00
项目类别:青年科学基金项目
2

基于注意力选择的卷积神经网络仿生正则化及其应用

批准号:61771145
批准年份:2017
负责人:顾晓东
学科分类:F0111
资助金额:62.00
项目类别:面上项目
3

基于深度卷积神经网络的快速磁共振成像方法研究

批准号:61601450
批准年份:2016
负责人:王珊珊
学科分类:F0125
资助金额:19.00
项目类别:青年科学基金项目
4

基于卷积神经网络的多次波自适应相减方法

批准号:41804110
批准年份:2018
负责人:李钟晓
学科分类:D0408
资助金额:25.00
项目类别:青年科学基金项目