System biology is a new subject which use statistics, bioinformatics and mathematical modeling strategies, to systematically analysis all functional components of the biology system and their interactions. Genomic selection(GS)currently only model additive genetic effects of SNP, and its performance is limited in genomic prediction of low heritability traits and in genomic prediction across populations and breeds. With the knowledge of system biology, we can more deeply and systematically understand the genetic mechanism of complicated traits (like feed conversion rate in pigs). Utilizing system biology information in currently GS model, has the potential to estimate SNP effects more correctly, for example with the possibility of modeling SNP interactions, and finally achieve more accurate genetic evaluation. In order to discover system biology information which is useful for GS, our project plan to analysis the network interactions of each components of system biology, using current abundant online system biology databases and websites. Meanwhile, based on Bayesian.hierarchical model, we intent to develop a new GS model which can directly use system biology information. Finally, with a pig population’s data, we will implement cross validation for the new model, and conduct GS for this pig population with this new strategy.
系统生物学是利用统计学、生物信息学和数学建模等理论,对生物系统的各组分(如基因组、蛋白质组和RNA组)的特性及其之间的相互关系,进行系统和综合研究的学科。基因组选择(GS)模型目前主要仅考虑标记之间的加性效应,不能够在低遗传力性状和多品种多群体的基因组遗传评估中取得显著效果。利用系统生物学知识,可以更加系统、深入地解释复杂性状 (如猪的饲料转化率)的遗传机理。将系统生物学知识应用于目前的GS模型中,有可能实现对SNP标记的效应更合理的估计,如估计SNP之间的互作效应等,进而实现对动植物个体育种值更为准确的遗传评估。本项目拟利用目前丰富的在线系统生物学数据库和网站,对系统生物学各组分进行网络互作等分析,挖掘出可用于GS的组学信息。同时,基于贝叶斯理论,研究利用系统生物学信息的GS新策略。最终,利用一个猪群体的数据,对新策略进行交叉验证分析,并基于此模型实施猪的GS。
基因组选择模型目前主要仅利用了表型和基因组信息。利用系统生物学策略,结合转录组、蛋白质组等多组学数据,可以更加系统、深入的解释复杂性状的遗传机理。本项目基于系统生物学策略,系统开展了利用多组学信息的猪基因组新模型研究。首先,基于猪的多群体实际表型和基因组数据,研究了多群体联合评估对基因组选择准确性的影响。研究发现利用基因组信息的评估提高了群体1总产仔和校正背膘厚的EBV准确性,同时提高了群体2的校正背膘厚的准确性。多群体基因组评估与单群体基因组评估相比,群体1的TNB准确性提升了1倍。其次,基于猪的实际总产仔数数据,研究了基于神经网络的机器学习策略构建基因组选择新模型。本模型与其他机器学习模型的评估准确性均低于GBLUP模型,但本模型的准确性明显高于其他机器学习模型。最后,基于小鼠和海马数据,利用转录组和基因组数据,采用梯度提升树GBDT的非线性整合思路,研究了多组学整合GS模型的评估效果。结果表明,Multi-Tree模型具有较好的稳健性,在不同的性状上均表现出了较高水平的评估准确性。我们的Multi-Tree新模型具有一定的生物学意义,其应用价值值得进行进一步的研究、挖掘。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
拥堵路网交通流均衡分配模型
转录组与代谢联合解析红花槭叶片中青素苷变化机制
卫生系统韧性研究概况及其展望
基于B2AR/CREB/FOXP3途径研究右美托咪定调控的调节性T细胞对乳腺癌术后转移和复发的影响
基于基因组选择和选配策略提高猪生长性状育种效率的研究
扇贝基因组选择育种中的近交控制研究
多性状全基因组关联分析新方法及其在设计育种中的应用研究
基于机器学习策略优化猪基因组选择的方法研究