基于家系数据集群化似然比的全基因组遗传风险预测方法研究

基本信息
批准号:81402762
项目类别:青年科学基金项目
资助金额:23.00
负责人:叶成荫
学科分类:
依托单位:杭州师范大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:孙晓燕,王大辉,沈歆,华鹭丹,江玲,朱素军
关键词:
交互作用易感遗传位点全基因组家系数据遗传风险预测
结项摘要

Genetic risk prediction for human complex diseases that capitalizes on emerging genetic discoveries holds great promise for improved personalized health care. With novel findings identified through the recently completed genome-wide association studies, hopes have been raised that these findings could eventually lead to a clinically useful genetic risk prediction model. Despite its great potential for improving health care, forming an accurate genetic risk prediction model remains a great challenge. This is partially due to the complex nature of such diseases’ etiology, which involves multiple genetic and environmental variants and their interactions. Existing approaches, which simply combine a limited number of established genetic and environmental risk predictors, will likely result in a genetic risk prediction model with insufficient accuracy. Thus, in this study we will develop an ensemble-based likelihood ratio (ELR) approach for family-based genome-wide genetic risk prediction, which takes into account the interplay of all potential genetic and environmental risk predictors, and also immunes to the biases caused by population stratification. With the advantage of taking low-marginal-effect predictors and their interactions into account, such an approach may address the limitations of existing risk prediction approaches and will lead to a more accurate genetic risk prediction model. Furthermore, by using a real data example, we will establish and mimic the integrated procedure of genetic risk prediction, that is, “forming a genetic risk prediction model using the ELR approach——evaluating variants' importance and assessing model’s clinical utility——optimizing risk prediction model——screening individuals of high risk”.

多因素控制的人类疾病已成为阻碍人类健康的最大敌人之一,其预防和治疗刻不容缓。构建高精确度的遗传风险预测模型是疾病从治疗向预防转变的关键,是有效降低疾病发生率和死亡率的第一步。但多因素控制疾病的遗传模式非常复杂,往往由多遗传易感位点和多环境因素协同作用形成,因此其遗传风险预测具有一定的挑战性。目前基于全基因组关联分析结果构建的遗传风险预测模型仍不够理想,使用的风险预测方法也非常有限。本研究采用集群化似然比的统计方法,建立基于家系数据的全基因组遗传风险预测模型。该方法将能够在全基因组范围内扫描潜在风险因子,捕捉边际或互作效应较低的风险因子,同时有效避免群体分层偏差,最终提高风险预测的精确度。本研究还将在此基础上以特定真实数据为例,实现“以新方法构建风险预测模型—建立模型入选风险因子的重要性评价和模型临床实用性评估—模型优化决策方案—高危人群的筛查”的遗传风险预测完整模式,并提供其可行性分析。

项目摘要

人类常见慢性病(心脑血管疾病、糖尿病等)发病率日益增高,成为了医学和健康领域亟待攻克的难题之一。普遍认为,控制慢性病高发的重要策略是将防治的重心从慢性病的治疗前移至慢性病的预防。其中,构建高精确度的疾病风险预测模型是锁定高风险人群,并对其进行早期干预,从而实现疾病预防策略的关键步骤,也是有效降低疾病发生率和死亡率的第一步。而基于个体遗传信息构建风险预测模型是常见疾病风险预测的重要环节。由多因素(遗传和环境)控制的常见疾病,其遗传模式非常复杂,往往由大量效应值较小的遗传易感位点和多环境因素协同作用形成,因此其遗传风险预测具有一定的挑战性。目前基于全基因组关联分析结果构建的遗传风险预测模型仍不够理想,现有的遗传风险预测方法也非常有限。本研究采用集群化似然比的统计方法,成功构建了基于大样本家系数据的全基因组遗传风险预测模型。该方法能够在全基因组范围内扫描潜在风险因子,捕捉边际或互作效应较低的风险因子,同时能有效避免群体分层产生的偏差,最终有效地提高了风险预测的精确度。本研究在完成新算法C语言软件包的基础上,分别从计算机模拟实验(不同的遗传模型和不同的家系结构)和真实数据应用(青少年品行障碍的大规模测序家系数据)两方面将新算法和现有的遗传风险预测算法进行了比较分析,验证了新算法的可靠性和稳健性,尤其在全基因组遗传风险预测中存在明显优势。同时,本研究还进一步探索了“疾病风险预测模型的构建—模型入选风险因子的重要性评价和临床实用性评估—模型优化—高危人群的筛查”的这一从预测模型建立到高危人群筛查的完整流程,不仅构建了基于电子病历的高血压风险评估模型,还将该模型在相关医院进行了推广应用,为高危人群筛查的提供了依据。本研究期许这一模式能够在未来整合更多类型的数据资源,例如大样本的全基因组测序数据,构建更为全面而精确的疾病风险预测模型,为人类常见慢性病的风险预测和早期干预提供理论和数据的支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
4

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

叶成荫的其他基金

相似国自然基金

1

基于惩罚似然和经验似然方法的高维数据假设检验问题研究

批准号:11701023
批准年份:2017
负责人:王珊珊
学科分类:A0402
资助金额:24.00
项目类别:青年科学基金项目
2

基于似然比检验控制图的若干研究

批准号:11201189
批准年份:2012
负责人:周勤
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目
3

基于家系测序数据的遗传风险预测模型的构建

批准号:81502887
批准年份:2015
负责人:温雅璐
学科分类:H3011
资助金额:18.00
项目类别:青年科学基金项目
4

密度比模型下的半参数经验似然推断

批准号:11771144
批准年份:2017
负责人:刘玉坤
学科分类:A0402
资助金额:48.00
项目类别:面上项目