全基因组关联研究中基因-基因、基因-环境交互作用统计分析方法研究

基本信息
批准号:81473070
项目类别:面上项目
资助金额:80.00
负责人:陈峰
学科分类:
依托单位:南京医科大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:郭丽,勾建伟,杨晟,段巍巍,张丽伟,张秋伊
关键词:
卫生统计交互作用数据挖掘统计方法全基因组关联研究
结项摘要

Despite the great success in identifying genes in genome-wide association study(GWAS), the single nucleotide polymorphisms (SNP) indentified through the single-SNP based approach or SNP set analysis only account for a small proportion of genetic variation. Complex diease is caused by muliple external factors (environmental exposure) and internal factors (genetic mutaion). Gene-environment interaction and gene-gene interaction may account for the missing heritability. Traditional methods for detecting interactions (logistic regression et, al.) in simple datasets or data mining approaches (random forest et, al.) in large-scale genetic datasets are no longer appropriate in GWAS datasets. Recently, many methods were proposed for detecting interactions in GWAS. However, they have obvious bugs in statistical algorithm or heavy computation burden. Based on these considerations, we aim to improve exsisted methods for detecting first-order interaction, proposed new methods and stratigies for detecting high-order interaction in GWAS. Furthermore, we will utilize parallel computing to speed up calculation based CPU/MPI or GPU/CUDA techniques. Additinally, the new proposed methods and softwares will be applied in real GWAS datasets to indentify gene-environment interactions and gene-gene interactions on genome-wide scale.

全基因组关联研究(GWAS)目前已经硕果累累。然而,基于单个位点或者一组位点主效应分析所检出的遗传位点仅能解释一小部分遗传变异。复杂疾病往往由多种外在因素(环境暴露)、内在因素(基因变异)相互作用导致,因此,基因-基因、基因-环境交互作用是复杂疾病不可忽视的重要形成因素!全基因组关联研究中,若忽视交互作用将导致遗传性缺失。然而,面对数十万个位点的数据,常规交互作用分析方法(如logistic 回归等)及中低维度数据挖掘方法(如随机森林等)受计算复杂度、运行速度限制,无法实现全基因组水平交互作用的检测。组学领域现有的高维数据交互作用方法仍存在统计算法不完善或计算速度不够快的缺陷。基于此,本课题拟改进现有一阶交互作用分析方法,并创新高阶交互作用方法和降维策略,控制假阳性、提高把握度;并利用计算机CPU、GPU 并行计算技术开发软件,软、硬件同时加速计算,使GWAS交互作用的分析成为常规方法。

项目摘要

复杂疾病常由环境暴露、基因突变相互作用导致。基因-基因、基因-环境交互作用是复杂疾病研究不可忽视的重要因素。然而,组学研究中的交互作用分析受计算复杂度、运行速度限制,很难实现全组学水平交互作用信号检测。本课题改进交互作用统计分析策略和方法,开发专用软件,使得全组学交互作用分析“有方法可循,有软件可用”。.(1) 交互作用分析的准备工作。从变量降维的角度,对常用的5种降维方法进行了系统评价。模拟试验显示:5种方法均能控制一类错误;当基因间存在一定相关性时,推荐效能相对较优的PCA和SKAT检验。针对多组学“块缺失”数据,提出“填补”和“架桥”两种分析思路。与传统填补方法相比,TOBMI填补算法精度最高,填补后能维持原数据结构和关系。此外,两种 “架桥”算法:全信息极大似然法和配对删除法,估计精度上也优于样本直接删除法。.(2) 交互作用分析的理论方法研究。一方面,针对罕见变异数据,提出LRT方差成分检验和基于PQL的方差成分检验,分别处理连续性和二分类结局变量的一组变量的交互作用研究。模拟试验显示:所提方法能够有效控制一类错误,且检验效能优于现有方法。另一方面,充分利用先验信息,提出BAL-VI和SurvEMVS两种Bayes模型,分别用于二分类和生存时间变量交互作用信号的平行快速筛选。模拟试验显示:所提方法具有参数估计误差小,预测准确度高,高维数据结构快速收敛等优点。.(3) 交互作用分析方法的应用研究。开发了4个交互式分析平台,使得复杂的交互作用研究变得操作便捷、易于实现。并基于肺癌国际多中心表观基因组合作研究、头颈部肿瘤与口腔癌表观基因组公共数据、中-美-孟出生队列代谢组数据等资源识别出多个疾病相关的生物学标志物。稳健的人群关联研究结果为生物学机制研究提供了有力证据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
4

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
5

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020

陈峰的其他基金

批准号:11535008
批准年份:2015
资助金额:300.00
项目类别:重点项目
批准号:91547115
批准年份:2015
资助金额:81.00
项目类别:重大研究计划
批准号:81772020
批准年份:2017
资助金额:55.00
项目类别:面上项目
批准号:81500210
批准年份:2015
资助金额:17.00
项目类别:青年科学基金项目
批准号:61005054
批准年份:2010
资助金额:22.00
项目类别:青年科学基金项目
批准号:70771063
批准年份:2007
资助金额:20.00
项目类别:面上项目
批准号:70973119
批准年份:2009
资助金额:22.00
项目类别:面上项目
批准号:81760308
批准年份:2017
资助金额:40.00
项目类别:地区科学基金项目
批准号:61671266
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:41405081
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:81460261
批准年份:2014
资助金额:47.00
项目类别:地区科学基金项目
批准号:31901243
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:71672115
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:31771081
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:11574324
批准年份:2015
资助金额:73.00
项目类别:面上项目
批准号:U1332121
批准年份:2013
资助金额:76.00
项目类别:联合基金项目
批准号:30670603
批准年份:2006
资助金额:22.00
项目类别:面上项目
批准号:51278029
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:81870747
批准年份:2018
资助金额:58.00
项目类别:面上项目
批准号:51472259
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:61071131
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:60772050
批准年份:2007
资助金额:27.00
项目类别:面上项目
批准号:10875075
批准年份:2008
资助金额:46.00
项目类别:面上项目
批准号:81470139
批准年份:2014
资助金额:30.00
项目类别:面上项目
批准号:30671146
批准年份:2006
资助金额:26.00
项目类别:面上项目
批准号:31471717
批准年份:2014
资助金额:91.00
项目类别:面上项目
批准号:51102258
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:11274203
批准年份:2012
资助金额:95.00
项目类别:面上项目
批准号:81701943
批准年份:2017
资助金额:19.00
项目类别:青年科学基金项目
批准号:39500127
批准年份:1995
资助金额:6.50
项目类别:青年科学基金项目
批准号:71272115
批准年份:2012
资助金额:48.00
项目类别:面上项目
批准号:61271388
批准年份:2012
资助金额:88.00
项目类别:面上项目
批准号:10505013
批准年份:2005
资助金额:28.00
项目类别:青年科学基金项目
批准号:81072389
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:70972070
批准年份:2009
资助金额:23.00
项目类别:面上项目
批准号:81570378
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:30571664
批准年份:2005
资助金额:25.00
项目类别:面上项目
批准号:81460629
批准年份:2014
资助金额:47.00
项目类别:地区科学基金项目
批准号:81200762
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:71871027
批准年份:2018
资助金额:48.00
项目类别:面上项目
批准号:81173510
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:30571619
批准年份:2005
资助金额:23.00
项目类别:面上项目
批准号:81400033
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:51404077
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:11204313
批准年份:2012
资助金额:30.00
项目类别:青年科学基金项目
批准号:81530088
批准年份:2015
资助金额:274.00
项目类别:重点项目
批准号:49972095
批准年份:1999
资助金额:17.00
项目类别:面上项目
批准号:61203265
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:60505018
批准年份:2005
资助金额:6.00
项目类别:青年科学基金项目
批准号:61775120
批准年份:2017
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

畜禽全基因组关联分析中基因交互作用检测方法研究

批准号:31460594
批准年份:2014
负责人:梅步俊
学科分类:C1702
资助金额:10.00
项目类别:地区科学基金项目
2

全基因组关联分析基因交互作用探测算法研究

批准号:61370172
批准年份:2013
负责人:谢民主
学科分类:F0213
资助金额:73.00
项目类别:面上项目
3

全基因组关联研究中的降维策略和统计分析方法研究

批准号:81072389
批准年份:2010
负责人:陈峰
学科分类:H3011
资助金额:32.00
项目类别:面上项目
4

全基因组关联分析中基因-基因交互网络比较的统计推断方法研究

批准号:31200994
批准年份:2012
负责人:袁中尚
学科分类:C0609
资助金额:20.00
项目类别:青年科学基金项目