The method of genomic estimated breeding values (GBEV) is the premise and foundation for carrying out the genomic selection. The optimal method of GEBV is the key to increasing the accuracy of selection in the genomic selection. The existing prediction methods of GEBV are based on the prior specification that all SNPs or haplotypes are in linkage equilibrium with each other not taking account of their correlations. The loss of information source leads to decrease the accuracies of GEBV. For this drawback, we use the ante-dependence model to fit the relationship of adjacent markers and adopt the MCMC-implemented Bayesian shrinkage method to estimate the GEBV. This novel method is called ante dependence Bayesian shrinkage method. In this research, we firstly study the basic principal of this new method and deduce the computing equations. Secondly, we employ the stimulation study to optimize the new method, develop a user friendly software and compare with the existing prediction methods of GEBV to find out its superiority. At last, we use the new method to analyze the dataset publicly available from the QTL-MAS Workshop and the real data to test the efficiencies of the new method and software. This research will enrich the theoretical system of genomic selection and provide a solid statistical foundation for the genomic selection, which promote the application of genomic selection and accelerate the genetic improvement in animals.
基因组育种值(GEBV)估计方法是实施基因组选择的前提和基础。探索最佳的GEBV估计方法,是提高选择准确性的关键所在。由于现有的GEBV估计方法主要基于SNP标记或单倍型之间相互独立,并未考虑相邻标记或单倍型之间的相关,损失了信息量,降低GEBV估计的准确性。针对这个问题,本项目利用前相关模型配合相邻标记或单倍型之间的相关,通过基于MCMC(Markov Chain Monte Carlo)算法的贝叶斯压缩方法估计GEBV,建立全新的GEBV估计的前相关贝叶斯压缩新方法,研究其基本原理。通过模拟研究优化新方法,与最新的GEBV估计方法比较其优越性,并开发相应的软件。然后,处理分析国际QTL-MAS Workshop颁布的公共数据和实际数据,进一步验证新方法及软件的有效性。本项目的实施对丰富基因组选择的理论体系、推动基因组选择在畜禽生产中的应用、加快畜禽遗传具有重要的理论和实际意义。
本项目利用前相关模型配合相邻标记或单倍型之间的相关,通过基于MCMC算法的贝叶斯压缩方法估计GEBV,建立全新的GEBV估计的前相关贝叶斯压缩新方法,通过模拟研究比较新方法与压缩贝叶斯方法的优越性,并考虑不同的影响因素(标记之间的连锁关系和QTL效应)去研究前相关压缩贝叶斯的统计效率,研究表明前相关贝叶斯压缩方法的准确性比贝叶斯压缩方法的准确性提高,但是所用的时间更长。进一步通过模拟研究验证单性状模型和多性状模型估计育种值的准确性进行了比较,通过研究表明多性状模型能够提高GEBV估计的准确性,特别是在低遗传力和少量表型记录的性状。用传统的单性状和多性状模型估计的EBV作为应变量对没有缺失数据估计GEBV估计的准确性影响比较少。但是对于缺失数据的情况下,多性状的GBLUP模型的估计准确性明显优于单性状GBLUP模型,即使是通过多性状模型估计的EBV作为应变量来说,这种优势仍然存在。并针对实验肉羊群体进行连锁不平衡和有效群体估计,其中苏尼特羊、德美羊和杜泊羊相邻标记之间的平均r2值分别为0.13、0.20和0.22,并构建了基于r2的连锁不平衡衰减图谱。结果表明r2随着标记间距离的增大而减小,至7世代前,苏尼特羊、德美羊和杜泊羊的有效群体大小分别为207、74和67只左右,并通过选择信号检测找到包括ASIP、RXFP2、BMP2、GSK3B、R3HDM1、RXRG、CXCR4、DLK1以及HOX基因家族等与毛色、角型、骨骼和肌肉生长发育、繁殖、免疫和毛囊生长发育相关的基因。本项目的实施将为全基因组选择和GWAS在畜禽生产中的应用和加快畜禽遗传改良具有重要的理论和实际意义。通过本项目的实施,发表学术论文6篇,协助培养硕士研究生和博士后各1名。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于铁路客流分配的旅客列车开行方案调整方法
一种基于多层设计空间缩减策略的近似高维优化方法
新型树启发式搜索算法的机器人路径规划
"多对多"模式下GEO卫星在轨加注任务规划
二维FM系统的同时故障检测与控制
阈性状基因组育种值(gEBV)估计的贝叶斯方法
利用贝叶斯方法估计LAMOST恒星参数
基于线性贝叶斯MAP估计和稀疏表达模型的图像插值算法研究
Errors-In-Variables模型的贝叶斯估计理论研究