基于家系测序数据的遗传风险预测模型的构建

基本信息
批准号:81502887
项目类别:青年科学基金项目
资助金额:18.00
负责人:温雅璐
学科分类:
依托单位:大连医科大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:吕德康,王佳,陈富顺,康志杰,陈成军
关键词:
风险预测阿尔茨海默病空间统计学全基因组关联分析遗传流行病学
结项摘要

Studies of genetic risk prediction represent high priority research projects worldwide. The advance in risk prediction will lead to new strategies in disease prevention and early detection. It will also improve drug development and benefit the research in personalized medicine. However, the risk prediction models formed to date are not suitable for next generation sequencing data and they can't make full use of the information from high-throughput data. These models lack sufficient accuracy for clinical use. In this study, with the consideration of gene-gene and gene-environment interactions we will build a risk prediction model within the random filed framework for family-based genome-wide studies. An efficient selection algorithm will be established to tease out noise factors from next generation sequencing data. The proposed method can incorporate the information provided by SNPs, rare variants and environmental factors. It can also make good use of the information provided from family members to further improve the accuracy of the risk prediction model. We will apply the new method to a real data example. We will first build a genetic risk prediction model, and then evaluate the importance of the selected predictors and the clinical utility of the prediction model. This study will shed light on the further improvement of risk prediction models, and provide data support for clinical use.

疾病的风险预测已成为国内外研究的热点,它对疾病的预防和早期诊断、新药开发以及个体化医疗方案的制订有着重要的意义。然而,现有的遗传风险预测模型并不完全适用于二代测序数据,无法深入挖掘高通量数据所蕴含的信息,其预测准确度普遍较低,无法满足临床的实际需求。本研究在综合考虑基因与基因及基因与环境的交互作用的基础上,针对家系测序数据构建基于随机场统计理论的遗传风险预测模型。该模型能够从二代测序数据中高效筛选出具有预测功能的SNP及罕见变异,能够考虑潜在的基因与基因及基因与环境的交互作用,还能够综合利用家族成员内部关联性所提供的信息,最终提高遗传风险预测的准确度。本研究将在此基础上以特定真实数据为例,利用新方法构建遗传风险预测模型,建立模型入选因子的重要性评价以及模型临床实用性评估的标准。本项目所建立的模型为进一步提高风险预测的准确度提供新的思路和理论根据,为临床医学提供数据上的支持。

项目摘要

近年来,利用高维基因组数据来预测疾病的风险已成为国内外研究的热点,它对疾病的预防和早期诊断、新药开发以及精准医疗都有着重要的意义。高通量测序技术的发展为遗传风险预测提供了海量的数据资源,但现有算法无法深入挖掘高通量数据所蕴含的信息,其预测准确度普遍较低。此外,针对家系数据而设计的风险预测模型的算法较少且均没有有效利用家系数据结构所提供的额外信息。本研究建立了基于随机场理论的适用于人群数据和家系数据的遗传风险预测模型。构建了两套变量筛选算法,即前向选择贪婪算法和基于Lasso的算法。为了提高参数估算效率,本研究还建立了针对Lasso在随机场模型下的近似算法。通过理论证明研究了模型的理论特性,包括参数的渐进分布和风险预测的误差等。本研究通过大量模拟实验和真实数据分析来验证模型的预测效果。本项目的所有算法均已在GitHub上发布。相比于传统算法,本项目的特色之处在于:1)通过核函数构建基因水平上的相似性有效的降低了数据的维数,2)首次将随机场理论应用于遗传风险预测领域,并通过样本间的空间距离来预测疾病风险, 3)构建了完整的在随机场模型下的变量筛选的统计理论,4)首次利用家族成员间的相关性来进一步提高家系数据的风险预测准确度。本研究以阿尔兹海默病为例,利用新方法构建了针对PET图像数据,雷伊听觉语言学习测试数据及阿尔兹海默病的疾病状态分别构建了遗传风险预测模型。较传统方法,新算法稳定的提高了模型的预测准确度,同时也筛选出了相应的预测基因。研究证实了尽管PET图像数据和雷伊听觉语言学习测试数据都是诊断阿尔兹海默病的重要依据,但影响他们的基因不尽相同。研究显示,APOE, FDG和MCM3AP对PET影像数据有预测作用,而APOE, HSPA5, ATF7, COX10和SERPINA则对雷伊听觉语言学习测试数据预测显著。本项目所建立的模型既可以为进一步提高风险预测的准确度提供新的思路和理论根据,又能为临床医学提供数据上的支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020

温雅璐的其他基金

相似国自然基金

1

基于家系数据集群化似然比的全基因组遗传风险预测方法研究

批准号:81402762
批准年份:2014
负责人:叶成荫
学科分类:H3011
资助金额:23.00
项目类别:青年科学基金项目
2

基于循证大数据的肛瘘复发风险评估及预测模型的构建研究

批准号:81774112
批准年份:2017
负责人:梅祖兵
学科分类:H3302
资助金额:55.00
项目类别:面上项目
3

基于最优ROC曲线的原发性高血压遗传与环境风险预测模型的构建

批准号:81273181
批准年份:2012
负责人:姜晶梅
学科分类:H3011
资助金额:60.00
项目类别:面上项目
4

整合遗传高维数据的贝叶斯多水平疾病风险预测模型构建方法与应用研究

批准号:81573253
批准年份:2015
负责人:汤在祥
学科分类:H3011
资助金额:25.00
项目类别:面上项目