Early complex disease prediction and prevention, such as essential hypertension (EH), is one of the most promising strategies in the 21st century. The present study, based on previous EH studies in Tibetan and Kazakh natural population which have simple genetic and environmental backgrounds, is aimed to establish optimal robust ROC curve model for EH prediction. The study focus on the following two key points: ① Using the optimal properties of the likelihood ratio (LR) and introducing LR into the ROC curve for modeling to improve the performance of ROC prediction; ② Using the kernel-based support vector machine method to solve the interactions among gene-gene or gene-environment in high levels which have been a blocking in constructing of complex disease predictive model. We continue the previous design, i.e., population-based case-control studies and randomized cluster sampling method. Based on the completion of the 2000 Tibetan samples and the 800 Kazakh samples, we will supplement 1400 Kazak data. The achievements of the current research will provide methodological support for clinical disease prediction and diagnosis, and create a new idea for the rapid translation from basic research into health care.
原发性高血压(EH)等复杂多基因疾病的预测是21世纪生命科学研究的重大问题和热点问题。本研究以EH为复杂疾病研究的切入点,以遗传和环境背景较单一的藏族和哈萨克族自然人群为研究对象,在既往研究基础上,建立基于最优ROC曲线的EH预测模型。研究立足以下二点:①利用似然比的优良性能完成ROC曲线建模,摆脱既往ROC曲线仅用单一指标进行预测的束缚,为复杂疾病预测提供方法学支持;②基因-基因和基因-环境高阶交互作用带来的"维数困扰"一直是复杂疾病建模的瓶颈问题,我们拟采用基于数学和计算机机器学习方法于一体的核函数支持向量机法予以突破。本研究延续以往设计,即以人群为基础的病例对照研究和随机整群抽样的方法,在已获取藏族样本2000人和哈萨克族样本800人的基础上,补充哈萨克族(1400人)资料。本研究成果将为临床疾病预测和诊断的发展提供方法学支持,也为基础研究成果转化并应用于临床和人群防治提供新的思路。
原发性高血压(EH)等复杂多基因疾病的预测是21世纪生命科学研究的重大问题和热点问题,然而作为提取生物信息的重要手段之一,统计学方法收到了前所未有的挑战,主要表现在很难定量表达基因-基因、基因-环境交互作用的网络和作用途径,解决这一问题的难点在于如何克服多变量高维空间的“维数困扰”和高阶交互作用的网状结构和通路问题。本研究以EH为复杂疾病研究的切入点,以遗传和环境背景较单一的哈萨克族自然人群为研究对象,主要进行以下两方面工作:①收集1400名哈萨克族自然人群人口学信息、流行病学、临床、实验室及基因检测资料,建立资源共享平台,探讨哈族人群高血压现状及心血管疾病风险因素,验证既往藏族样本中已发现的EH易感基因;②从方法学角度建立可处理高阶交互效应的最优ROC预测模型,并完成模型验证及调试。..该人群整体高血压患病率较高(男性50.0%,女性41.1%),男女性中均为牧民最高。男性和女性中分别有89.7%和65.7%的人至少存在1种心血管疾病风险因素(高血压、吸烟、肥胖、糖尿病以及高脂血症)。在该以高盐高脂、低蔬菜水果摄入为饮食特点的人群中,血压的分布随着尿钠水平升高存在上升趋势,校正年龄、BMI、吸烟、饮酒以及蔬菜水果摄入后,尿钠水平最高组相对于最低组有着显著的高血压患病风险,男性:OR=1.61 (95% CI: 1.02–2.54) ;女性:OR=1.92 (95% CI: 1.13–3.27)。进一步引入盐敏感基因的结果说明,该人群ACE基因和高血压的关联在男性和女性中存在差异,且ACE基因和盐摄入对高血压的交互作用在男性女性中均存在。而使用四种模型探讨该交互作用,模型的AUC均在80%以上且几乎没有差异。其中logistic模型在从每个家庭随机抽取一人的568人样本中得到盐摄入量与ACE I/D基因多态性间存在交互作用,其检验效能为85.5%,模型的ROC曲线下面积为0.8277。..本研究结果主要意义包括:①在临床复杂疾病的预测和诊断方面提供方法学支持;②为我国哈族及与哈族生活习性类似且高血压患病率较高的民族(蒙古族、藏族等)在人群高血压防治方面提供依据和参考。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
基于结构滤波器的伺服系统谐振抑制
极区电离层对流速度的浅层神经网络建模与分析
基于贝叶斯统计模型的金属缺陷电磁成像方法研究
楼梯疏散三维建模的改进社会力模型
基于ROC曲线分析理论的矿产预测与效果评价的通用效益-代价模型研究及应用示范
基于家系测序数据的遗传风险预测模型的构建
基于妇幼健康大数据的妊娠高血压和子痫前期风险预测模型的构建与验证研究
盐敏感性高血压候选基因的验证及其风险预测模型的构建