Mixed-model-based genome-wide association studies (GWAS) in crop were increasingly and widely used in the past several years. However, the widely used approach in the world is single marker analysis based on population structure and polygenic background controls, and a stringent threshold of statistical significance results in no significant loci in the GWAS for quantitative traits in crop to be detected. Based on our strongly previous works in the GWAS methodology, in this project, multi-locus model method, rapid and precision calculation algorithm in the GWAS, new approaches in mathematical statistics and variable selection techniques will be integrated into one framework of new GWAS methodology. First, high precision and rapid calculation algorithm in the multi-locus-model-based GWAS with mass SNP markers will be developed, and the detection for epistasis in the GWAS will be considered. Then, the above new approaches in this project will be extended into genetic linkage analysis, our purpose will increase the power in the detection of small and linked QTL and the precision for QTL parameters, and the detection for epistasis in the linkage analysis will be considered. Third, two applied studies for seed size traits in soybean will be conducted and our purpose is to confirm the above new approaches. One is the GWAS in 286 wild, landrace and bred soybeans with 106013 SNPs; and the other is linkage analysis in 520 recombinant inbred lines with approximately 10000 SNPs. Finally, the windows version software for the validated approaches will be written. As a result, four SCI papers will be published, one software will be available, three doctoral students and three graduate students will be trained.
基于混合线性模型的作物全基因组关联分析应用研究日益广泛。但是,国际上通用的方法是基于背景控制的单标记分析,过严的显著性概率标准(1E-8)常常使作物关联分析不易检测到显著性关联位点。本研究根据申请者在关联分析方法学中的坚实工作基础,结合多位点模型方法、关联分析精确快速计算算法、参数估计新方法和变量筛选技术,开展:1)海量SNP标记、高精度和快速检测的多位点关联分析新方法研究,并探索上位性检测的可行性;2)将新方法应用于连锁分析以提高背景控制效果,达到提高连锁分析中小效应与连锁QTL的检测功效与精度,并探索上位性检测的可行性;3)将新方法应用于286份大豆品种106013个SNP和520份大豆正反交重组自交系群体1万个左右SNP的种子大小性状的关联分析与遗传连锁分析,以验证新方法的可行性;4)新方法的应用软件包研制。发表SCI论文4篇,研制软件包1套,培养博硕士研究生各3名。
针对国际上广泛使用的单标记全基因组扫描关联分析方法显著标准高情况下检测QTN不易的国际难题,特别是作物田间试验误差较大时,本项目在适当降低显著标准和严格控制假阳性率原则下,构建了海量标记、高精度和快速检测的两阶段随机SNP效应混合模型关联分析新框架,其创新点是将SNP效应视为随机效应,提出各种算法尽可能多地选择潜在关联QTN,将所有潜在关联QTN放入全遗传模型,利用经验Bayes方法估计全模型遗传参数并鉴定显著关联QTN。模拟与应用研究表明,本项目提出的mrMLM、FASTmrEMMA、ISIS EM-BLASSO、pLARmEB和pKWmEB新方法的QTL检测功效比国际通用GEMMA、EMMAX和FarmCPU方法高20%左右,特别是小效应QTN;精度显著优于单位点方法;特别是新方法有效控制了假阳性率在0.05%以下,与国际流行方法相当。有效地解决了作物数量性状关联分析的难题。被Nat Commun等论文引用250次(Google学术),引用涉及作物、动物、林木和人类遗传分析。针对双亲分离群体小效应和连锁QTL检测在国际上仍然十分困难这一科学问题,本项目提出了回交和F2等群体多QTL检测的全基因组复合区间作图GCIM方法,其创新点是多基因背景控制更彻底,尽可能将所有潜在的QTL(包括小效应与连锁QTL)放入全遗传模型,利用经验Bayes方法估计全模型遗传参数并鉴定显著QTL,分别拟合F2群体加性与显性效应。GCIM检测QTL功效比国际上流行的CIM高25%(回交)和43%(F2),比ICIM高30%(F2),主要是GCIM能检测更多的小效应与连锁QTL,有效地解决了小效应与连锁QTL检测的国际难题。此外,探索了两种情况下基因或位点间的上位性检测、基因组变异与复杂性状形成的分子进化机制。在Brief Bioinform和Mol Plant等杂志发表SCI论文16篇(IF>9.0论文3篇,引用数>50次2篇),主编Front Plant Sci杂志本项目新方法应用研究专辑1部,研制的R软件包mrMLM和QTL.gCIMapping及其代码可在R和BioCode平台上可免费下载,参与撰写Methods in Molecular Biology专著第5章,培养博士硕士7人,学术报告与培训班涉及3000余人,总引用300余次。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
动态性状的快速高效多位点全基因组关联分析新方法研究
多位点蛋白修饰检测的middle-down组学质谱分析新方法
高通量快速检测含有杂合基因型关联群体的多位点GWAS方法学研究及其软件包研制
融合基因结构特性的多位点关联分析的统计学方法研究