基于多模态医疗数据的病人相似度的建模与学习

基本信息
批准号:61672420
项目类别:面上项目
资助金额:62.00
负责人:钱步月
学科分类:
依托单位:西安交通大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:樊林,魏笔凡,董博,姜琨,王志晓,张开元,宋凌云,曹世磊,占梦婷
关键词:
相似度建模主动学习迁移学习相似度学习医疗数据分析
结项摘要

Evidence based decision making has been identified as one of the central goals for healthcare transformation. During the last decade, Electronic Medical Records (EMR), Electronic Health Records (EHR), drug development data, patient genomic information, etc., are becoming readily available for a huge amount of patients. These new resources are valuable for generating evidence. Patient similarity, which measures how similar a pair of patients are according to their historical information under a specific clinical context, will be the enabling technique for data driven medical support. There is some existing work on applying patient similarity in various applications in the medical literature. However there are still significant challenges on learning effective patient similarities, which, to our knowledge, have not been systematically addressed: heterogeneity, sparsity, limited supervision, and bias. Our study aims to solve the four challenges, and will be conducted on a set of large-scale real medical datasets. The learnt similarity models will be evaluated on four medical applications, including case based reasoning, disease subtyping, pharmacovigilance, and personalized medicine.

在当今的医疗智能化变革进程中,基于证据的医疗决策已经被公认为是核心问题之一。近年来,电子病历记录、电子健康记录、药品研发领域、基因信息等新的信息技术已经被广泛的应用在患者身上。这些新的数据源为医疗决策提供了有效的数据证据。病人相似度,作为衡量在特定临床环境下患者间历史记录相似性的度量,为基于证据的医疗决策提供了技术基础。现有的文献中,已经有一些将病人相似度应用于各类型的医疗应用中,但根据我们的调研,还有很多重大的问题被忽视。其中,病人相似度的建模与学习问题是一个基础性问题,是利用计算机的速度和存储扩展医生的记忆和经验的基础性研究。本项目致力于解决病人相似度学习中的四大难题:异质性、稀疏性、缺少监督、偏向性。研究工作将依托多个来源的大规模真实医疗数据推进,所获相似度模型将应用于以下四个具体的医疗辅助应用,并验证该模型的有效性:基于病案的推理、疾病子类型化、药物警戒性、个性化用药。

项目摘要

近年来医疗数据不断积累,使得人们不再满足于对医疗数据的简单浏览和基本统计,希望利用大规模机器学习和数据挖掘算法对医疗数据进行深度分析,借助人工智能技术辅助医生的诊断和施治过程。医生诊断和施治实际上就是在脑海中寻找相似的病人,回忆这些病人的病情发展状况,比较不同药物对病人的有效性,进而推测当前病人可能的病情发展并采取措施。因此本项目致力于研究用计算模型来模拟医生的这一推理过程,通过病案训练该模型,在瞬间检索成千上万的相似病例,利用计算机的速度和存储扩展医生的记忆和经验。其中,病人相似度的建模与学习问题是一个基础性问题,其在于解决病人相似度学习中的四大难题:异质性、稀疏性、缺少监督、偏向性。本研究涉及到的医疗数据主要来源于四个信息化系统:HIS(Hospital Information System)记录患者的门诊信息,LIS(Laboratory Information System)记录患者的辅助检查信息,RIS(Radiology Information System)记录患者的医学造影信息,和 EMR(Electronic Medical Record)综合记录患者的医疗记录。其中 EMR 是医疗数据的综合载体,汇集了其余三个系统的绝大部分重要信息,并且包含详实的住院记录。本研究通过将多源、异构、稀疏的电子病例数据融合,在医疗知识和医生专业意见的监督下,训练得到性能稳定、交互式、可迁移的描述患者间相似度的数学模型,并基于相似度模型这个核心技术延展出有实用价值的智能医疗应用,解决了病人相似度学习中的难题。具体研究结果包括:1) 提出可以接受多源、多形态医疗数据的病人相似度模型,充分利用电子病历中记录的各种类型的数据。2) 将医疗背景知识和医生专业意见引入到相似度模型的训练中,实现精准的病人相似度描述和人机交互。3) 研究相似度模型的可迁移性,实现模型跨人群、跨地域的综合学习。4) 以相似度为核心延展出多个智能医疗应用,开发实用级的在线系统,辅助医生进行更加精准的医疗行为。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
4

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

钱步月的其他基金

相似国自然基金

1

基于层级多模态的深度相似度学习方法研究

批准号:61806066
批准年份:2018
负责人:高欣健
学科分类:F0604
资助金额:24.00
项目类别:青年科学基金项目
2

多模态对象的相似度学习方法及其应用研究

批准号:60975043
批准年份:2009
负责人:姜远
学科分类:F0603
资助金额:30.00
项目类别:面上项目
3

基于深度学习的多源多模态城市大数据融合建模

批准号:61772342
批准年份:2017
负责人:彭敦陆
学科分类:F0202
资助金额:62.00
项目类别:面上项目
4

基于多模态医疗数据融合的肾小球滤过率机器学习预测模型研究

批准号:81873631
批准年份:2018
负责人:刘迅
学科分类:H0511
资助金额:57.00
项目类别:面上项目