Cardiovascular disease (CVD) remains the grip reaper’s primary calling card. Disease prevention must be seen as a life-long effort. Major strategies in CVD prevention require measurement of CVD risk. Several models for CVD risk prediction have been developed and updated in the Western population while the algorithms for Chinese population were based on the cohort ended before 2002. The CVD risk prediction model for the Chinese population under current economic levels and the public health modelling of the screening strategies are limited. We aim to develop the population-based CVD risk prediction model for the Chinese population using the big data from the healthcare information system in Ningbo as the discovery data and validated in the independent cohort study established in Beijing. Several well-known models derived from the Western population will be firstly re-calibrated in the population-based discovery cohort using the clinical practice records of residents in the town in Ningbo. The original and the re-calibrated scores will be directly compared and evaluated. We will then develop and evaluate novel scores by combining features not used in concert by previous studies, and by exploiting extensive candidate and discovery data using multiple methods including traditional parametric regression and machine learning algorithms such as random forest. To help avoid “overfitting”, we will use cross-validation in the discovery cohort and external validation using the epidemiological cohort study established in Beijing. Finally, we will assess various screening options including the proposed sequential screening strategy, comparing their consequent estimated effects in CVD prevention in a wide range of circumstances. The project will provide the latest evidence for population-level CVD primary prevention and tools for individualized CVD risk management in China.
心血管疾病危害严重,风险预测对疾病防治意义重大,预测模型在国际上发展迅速,但针对中国人群的风险评估工具较少、预测模型较老,公共卫生筛查策略有待完善。因此,本研究拟利用宁波市鄞州区区域信息平台的健康大数据,通过该地区的全人群自然队列,结合北京市房山区的前瞻性队列研究,建立中国人群的疾病风险预测模型。首先选取QRISK2、Framingham风险评分等经典预测工具,对原始评分和校准后评分在现阶段中国人群中进行直接对比评估;然后在本课题组前期英国研究的基础上,通过随机森林等多种方案在数据库中筛选合适的因子,开发更为精准的基于竞争风险的预测模型,再利用北京市房山区的前瞻性队列研究对新开发的模型进行验证;最后,提出适合我国现阶段国情的公共卫生序贯筛查策略,应用预测模型结合贝叶斯统计方法对管理与决策导向的健康大数据公共卫生筛查策略进行评估,为我国人群心血管疾病一级预防及患者个体化疾病风险管理提供依据。
心血管疾病危害严重,风险预测对疾病防治意义重大,预测模型在国际上发展迅速,同时,医疗健康领域大数据的开发使用正在全球范围内受到广泛关注。利用以电子健康档案为核心的大数据进行个体心血管疾病风险预测的研究也逐渐成为医疗健康大数据转化研究的重要方向之一。本项目对宁波市鄞州区区域卫生信息平台中相关的管理型数据进行了梳理,建立了中国鄞州电子健康档案研究项目,对以电子健康档案为基础的大数据进行了科研转化的理论范式研究,特别就真实世界数据中的矛盾数据、缺失数据以及重复测量数据提供了相应的统计分析方案,完成了该地区1,053,565名成年人的基于电子健康档案的自然人群队列的构建。本研究中,项目组建立了适用于当地人群的心血管疾病风险评估工具,并对模型的预测能力进行了评估,结果表明该工具在当地人群具有较好的风险预测能力。最后从全人群的慢性病健康管理的角度出发,通过定量评估的方式选择制定了适合当地人群的筛查策略,为针对不同风险等级的人群采用不同的预防干预措施,实现基于综合风险评估的心血管疾病健康管理在应用层面上的粒度缩放打下了基础,探索建立一套大数据驱动的综合风险评估、疾病筛查,以及高危人群动态预警和干预的慢性病管理模式。从横向层面看,实现了多维数据交互,涵盖微观的个体临床生物标志物,中观的个体症状和医疗活动和宏观的环境因素;从纵向层面看,医院信息、社区卫生信息和人群监测等多源数据的互联互通,便于捕捉个体健康的动态轨迹信息。通过将不用维度和不同节点的数据进行聚合分解,促进了多源异构的内外数据融合,体现了大数据问题粒度缩放和跨界关联的特点。在此基础上,通过构建心血管疾病风险预测模型,制定高危人群筛查策略,从慢性病发生、发展的时间、空间和人群的全局视图设计基于证据的可操作性的慢性病动态管理模式,提升了大数据的使能创新能力,完成了大数据研究成果的转化应用,充分实现了医学信息和管理决策相结合的全局视图下的跨界关联。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
我国外周动脉疾病的危险因素及心血管疾病死亡风险预测模型
整合遗传高维数据的贝叶斯多水平疾病风险预测模型构建方法与应用研究
基于家系测序数据的遗传风险预测模型的构建
基于循证大数据的肛瘘复发风险评估及预测模型的构建研究