基于整合组学先验知识的全基因组关联分析模型开发

基本信息
批准号:31902156
项目类别:青年科学基金项目
资助金额:23.00
负责人:付玉华
学科分类:
依托单位:武汉理工大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
基因组整合分析人工智能全基因组关联分析
结项摘要

With the reduction of genotyping and phenotyping costs, genome-wide association analysis (GWAS) is widely used to identify loci linked to important economic traits in livestock. However, current GWAS models can only support the statistical information, they were limited by the complicated linkage disequilibrium (LD) structure and distal regulation of gene, and the causal genes often remain unknown. The interpretation and narrowing of large lists of highly associated SNPs with complex traits by using the information form other omics level are now the bottleneck in developing new GWAS model understanding of how genes influence traits. This study is designed to construct a swine integrated omics gene scoring system and develop a GWAS model base on prior knowledge of integrated omics by using the machine learning strategy, which lays a foundation for the precise mapping of genes related to important economic traits. This study is designed to provide a GWAS statistical method based on integrated omics information, which can not only improve the statistical power of the GWAS model based on gene scoring system of the integrated omics and achieve the precise mapping of causal genes, but also can be combined with the integrated omics database to interpret the results of GWAS and provide evidence of causal genes influence traits. This method will provide new ideas and tools for the precise mapping and interpretation of genes related to important economic traits in pigs.

随着高通量测序成本和表型测定成本的降低,全基因组关联分析被广泛地应用于家畜重要经济性状相关位点的定位。然而,当前全基因组关联分析模型仅支持使用统计信息,无法避开连锁平衡定律限制和基因远端调控影响,因果基因往往难以判断。如何利用更多的组学证据,从大量的关联位点中定位因果基因,揭示基因调控性状机理成为了当前全基因关联分析模型的瓶颈。本项目利用机器学习策略,结合猪整合多组学基因评分系统,设计实现以多组学信息为先验知识的全基因组关联分析模型,为重要经济性状相关基因的精准定位奠定了基础。本研究拟提供一个基于整合组学信息的GWAS统计方法,该方法既可基于整合组学基因评分系统提高GWAS模型的统计效力,实现因果基因的精细定位,又可结合整合组学数据库辅助猪GWAS结果解读,提供因果基因控制性状的证据。该方法将为猪的重要经济性状相关基因精准定位和解读提供新思路和新工具。

项目摘要

在动植物遗传育种工作中,重要经济性状相关基因的定位尤为重要,定位结果的准确与否直接影响遗传改良进展。为了实现精细定位,各物种用于全基因组关联分析的数据集越来越大,然而即便是当前最主流的多位点模型也仅仅依赖统计信息,无法避开连锁不平衡的限制和基因远端调控影响,如何从大量的显著性位点中定位因果基因成为了当前全基因组关联分析研究的瓶颈。为了解决这个问题,很多研究选择引入多组学信息,但是当前组学整合方法往往仅限于简单的叠加或者需要针对实验设计特定的数据集,信息利用程度不高、数据复用率低,大大的增加了全基因组关联分析的成本,难以在育种实践中大规模展开。为了跨出全基因组关联研究的最后一公里,提出整合组学辅助 GWAS 精细定位的通用方案。本项目将针对猪所有已公开发表的基因组、转录组、文献组、QTX数据,利用机器学习策略,构建猪基于多组学整合的基因评分系统,设计实现以整合组学信息为先验知识的全基因组关联分析模型。主要研究内容包括:(1)收集52.88TB高通量数据和653篇文献数据,构建了当前猪最大的基因组、转录组及QTX数据集,为猪公共多组学数据的复用奠定了数据基础;(2)构建了猪的首个基于卷积神经网络的基因-性状评分模型,能够综合利用多组学信息对GWAS候选区域的潜在因果基因进行推断,模型准确性、召回率和综合指数F1分别为72.9%、73.5%以及73.4%。(3)构建了国际上首个猪多组学整合知识库ISwine(http://iswine.iomics.pro),用户能够方便的在线调用猪的多组学数据并使用多组学整合模型实现潜在因果基因的精准定位。(4)培养博士后1人,博士研究生2人,硕士研究生4人,发表SCI论文5篇。本项目新方法的开发将为猪的重要经济性状基因的精细定位提供新思路和新工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

付玉华的其他基金

批准号:51464015
批准年份:2014
资助金额:45.00
项目类别:地区科学基金项目

相似国自然基金

1

东北大豆低聚糖全基因组关联分析及功能标记开发

批准号:31671712
批准年份:2016
负责人:王跃强
学科分类:C1307
资助金额:25.00
项目类别:面上项目
2

基于网络的全基因组关联分析方法

批准号:31471246
批准年份:2014
负责人:邓明华
学科分类:C0608
资助金额:70.00
项目类别:面上项目
3

泛全基因组关联分析:人类复杂疾病全基因组关联分析的整合研究

批准号:11601259
批准年份:2016
负责人:侯琳
学科分类:A0403
资助金额:17.00
项目类别:青年科学基金项目
4

基于序列并整合生物学先验的全基因组预测新方法研究

批准号:31772556
批准年份:2017
负责人:张哲
学科分类:C1702
资助金额:61.00
项目类别:面上项目