Big data analysis and mining is the key support technology of regional health information service. Besides the 4V characteristics of common big data, data of regional health information service system based on cloud computing and MapReduce based has additional characteristics, such as long life cycle, complex pattern and relationship, heterogeneity, distribution, and etc. Consequently, traditional resolutions cannot be directly applied to regional health big data mining. Taking cardiopulmonary occupation disease, infectious disease of respiratory system and lung neoplasms as subjects, we focus our attention on problems of the formal modeling and software test, distributed big data mining algorisms and models, and privacy preservation, respectively. Based on rCOS and FSM model, we propose distributed formal modeling and auto-testing resolutions for regional medical big data mining system. Based on machine learning theory and new computing pattern, we put forward a series of models and algorisms for regional medical big data mining. Statistically based methods and tools are adopted to validate performance of the proposed resolutions. Privacy preserving resolutions presented to protect both sensitive data and sensitive patterns. Sensitive data are hidden by combing multiple stepwise regression model and encryption algorithms, while sensitive patterns are preserved by combing encryption and secure multi-party computation together.
大数据分析与挖掘是实现区域医疗服务的关键支撑技术之一。基于云计算和MapReduce模型的区域医疗数据除具有一般大数据的4V特征外,还具有生命周期长、数据模式和关系复杂、异构性和分布性等特性。因此,区域医疗大数据的挖掘无法直接采用传统的方案实现。以心肺性职业病、呼吸系统传染性疾病和肺部肿瘤为具体研究对象,以疾病模式分析、疾病异常检测和个性化治疗等为具体的应用,深入探索医疗大数据挖掘系统的形式化建模和检测、分布式挖掘算法,以及用户的隐私保护问题。提出基于openEHR Archetype和rCOS的区域医疗系统互操作建模方法和测试技术;针对具体医疗应用,提出一系列基于机器学习和MapReduce模型的分布式医疗大数据挖掘算法,并采用基于统计学的工具验证;在隐私保护方面,采用多元逐步回归模型和数据加密技术隐藏用户的敏感数据,以及基于同态数据加密技术和安全多方计算的方式实现隐私模式的保护。
本项目以基于云计算和 Hadoop 框架的区域卫生服务信息系统为应用场景,对医疗大数据挖掘应用相关技术进行深入研究。重点研究基于云计算和 Hadooop 框架的医疗大数据挖掘和分析模型的检测和测试技术、针对特定医疗服务需求的区域医疗大数据挖掘算法和技术,以及医疗大数据挖掘中的隐私保护问题。. 本项目的主要贡献如下:(1)通过优化临床路径标准诊疗方案,提出了一种基于诊疗单元划分的临床路径优化诊疗策略。(2)总结了现有模型和方法的优点与不足,利用人工智能和数据挖掘等先进的数据分析技术完善了现有的建模方法;利用大数据技术,提高了用于心血管疾病风险评估建模的数据质量。(3)在基于大数据分析技术的区域医疗环境下,对医院物资消耗及下周期购买预测技术进行了研究,面向基于 Hadoop 平台的区域医疗环境,研发了基于数据挖掘的医院物资采购量预测系统。(4)针对物联网新的环境和现有用户隐私保护技术的不足,提出并实现一种基于移动用户智能终端的隐私信息保护方法。. 本项目的研究成果目前已经扩展到区域医疗卫生信息服务系统,为促进我国医疗领域信息化、区域化发展提供有价值的参考。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
硬件木马:关键问题研究进展及新动向
中国参与全球价值链的环境效应分析
二维晶体MX2(M=Mo, W;X= S, Se)电催化剂的活性位点,电输运调控及其协同催化机理研究
基于云计算的大数据分析关键技术和算法的研究
基于云计算的医疗大数据临床决策问题研究
云/雾计算环境下电子医疗数据安全和隐私保护关键技术研究
基于认知计算的大数据分析方法