For exploring more valuable information from smart health big data, it is very difficult to fuse multi-source heterogeneous big data and meet the requirements of the management decisions from micro level to macro level. This project will analyze the smart health management decision mechanisms based on whole process of healthcare to mine the decision models and implementation mechanism based on semantic rules. Then, we will propose a multi-source heterogeneous big data fusion method with semantic analysis and knowledge discovery to build the health knowledge graph. The decision process will be calculated in real time and presented clearly through a big data computing platform. Finally, our research will be verified through a prototype. This project will solve the key problems of smart health management decisions, facilitate the theory of big data fusion, which is very important to the construction of the smart health management decision support systems from micro level to macro level.
如何实现多源异构大数据的有效融合,并让融合后的数据满足微观到宏观各个层次智慧健康管理决策所需,一直是从智慧健康大数据有效挖掘出更大价值所面临的一个巨大难题。本项目旨在通过对面向全流程智慧健康管理决策机制的分析,挖掘出全流程智慧健康管理决策所需要的模型以及基于语义规则的决策支持系统的实现机制,提出一种满足全流程智慧健康管理决策模型所要求的多源异构大数据融合方法以及融合过程中所需要的语义分析和知识发现机制,构建健康知识图谱,通过大数据计算平台实时计算并清晰地展示出全流程智慧健康管理决策的过程,并通过原型验证系统进行验证等内容。本项目将解决智慧健康管理决策所面临的核心技术难题,促进大数据融合理论的进一步发展,在应用上对构建满足从微观到宏观决策的智慧健康管理决策支持系统也具有重大意义。
医疗健康领域里存在的数据的多源异构现象严重阻碍了数据的共享和使用,加剧了人民群众看病难和看病贵等社会问题。如何实现多源异构大数据的有效融合,并让融合后的数据满足微观到宏观各个层次智慧健康管理决策所需,一直是从智慧健康大数据有效挖掘出更大价值所面临的一个巨大难题。本项目分为4个课题进行研究:全流程智慧健康管理决策模型与规则、健康知识图谱与数据融合、健康大数据的语义分析与知识发现、以及支持智慧健康管理决策的大数据计算平台。重要的研究成果包括:基于多因素解耦合的治疗方案推荐算法的工作发表在CIKM2020,在疾病决策系统、辅助诊疗系统等拥有广泛的应用场景和极强的现实意义;松弛的双语词典构建方法的工作在ACL 2020发表,大大提高了跨语种的知识图谱构建能力和效率;关于临床终点预测的异构时序事件联合表示学习模型的工作在AAAI2018发表,引起了国内外同行的广泛关注,并展开了落地合作;有界的近似查询处理框架BAQ在TKDE2019发表,得到了包括华为等公司和学术界的高度关注;所研发的验证平台包括华鼎大数据管理平台和华鼎大数据云分析平台应用已经部署在86家医疗机构中。本项目还形成了医疗机构数据集:心内科门诊与住院数据数据集,涵盖5万患者,共计80万人次,时间跨度从2004年到2015年;全科门诊与住院数据集,涵盖14万患者,共计20万人次,时间跨度从1987年到2018年;膝骨科门诊与住院数据数据集涵盖6千患者,共计1万5千人次,时间跨度从2014年到2020年。构建了一个大型医疗健康知识图谱,包括心内科知识图谱(3327万)、全科知识图谱(6.98亿)、膝骨关节炎知识图谱(770万)、MIMIC3知识图谱(1344万)、CUMLS图谱(1054万)、新冠肺炎诊疗、预防和康复图谱(0.7万)。这些数据有力的支持了本项目中相关方法、模型和算法的研究,未来在医疗健康辅助决策、新药研发和全民健康等方面都有广阔的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
面向全人群全生命历程健康管理决策的多源异构时空大数据融合方法研究
面向不确定性多源异构数据融合分类方法的小微企业信用评级研究
面向公共安全的多源异构数据融合的群体行为分析与挖掘
基于多源数据融合的风电机组健康状态评估及预测方法