This project focuses on analytics of Electronic Medical Records (EMR) under the environment of healthcare big data and deal with practical healthcare management and decision-making problems, such as the identification of patient cohort, discovery of drug combination module, extraction and evaluation of typical treatment regimens and construction of clinical pathways. To accomplish these tasks, this project intends to use exemplar-based clustering methods to develop clustering models and algorithms that consider the properties of EMR to mine the diagnosis and treatment patterns hidden in EMR. The main research objectives include: (1) Proposing methods for EMR preprocessing, feature representation and similarity measurement; (2) Developing fast clustering models and algorithms for large-volume EMR; (3) Designing dynamic and evolutionary clustering algorithms for EMR; (4) Providing typical applications of the proposed clustering algorithms in EMR mining. The theoretical significances and practical values of this research are two-fold. First, this study can enrich the study of clustering methods for healthcare big data mining by analyzing the characteristics of the EMR data and developing clustering models and algorithms suitable for large-volume, dynamic, and temporal EMR data. Second, the proposed clustering models and algorithms will be applied in practical EMR mining by cooperating with medical organizations, which can provide clinical decision support for disease diagnosis and treatment.
本项目将以健康医疗大数据环境下的电子病历为对象,针对病人群落识别、联合用药群组模块发现、典型治疗方案挖掘及评价与临床路径构建等健康医疗管理与决策问题和数据挖掘实际应用背景,以基于代表点的聚类方法为研究手段,设计针对电子病历数据特性的聚类模型与算法,挖掘与分析真实电子病历数据中隐含的诊断和治疗模式。具体研究内容包括:(1)电子病历数据预处理、特征表示与相似性度量方法;(2)面向大规模电子病历数据的快速聚类模型与算法;(3)面向电子病历数据的动态聚类模型与算法;(4)基于聚类分析的电子病历挖掘典型应用。本项研究的理论意义和应用价值在于:一是通过对电子病历数据特性分析,构建适于大规模、动态时序化电子病历数据的聚类模型与算法,推进和丰富健康医疗大数据环境下的聚类方法研究;二是所设计的聚类模型和算法将通过与医疗机构的紧密合作将其应用于实际的电子病历挖掘中,为医务人员疾病诊断和治疗提供临床决策支持。
本项目以健康医疗大数据环境下的电子病历为对象,针对病人群落识别、联合用药群组模块发现、典型治疗方案挖掘及评价与临床路径构建等健康医疗管理与决策问题和数据挖掘实际应用背景,以基于代表点的聚类方法为研究手段,设计针对电子病历数据特性的聚类模型与算法,挖掘与分析真实电子病历数据中隐含的诊断和治疗模式。.项目主要研究成果包括:(1)提出了电子病历的生成、分析及利用一体化研究框架,深入分析了电子病历数据的特点,针对电子病历数据的特点,提出了多种电子病历数据预处理、特征表示与相似性度量方法;(2)针对电子病历数据挖掘的实际需求,系统研究了基于代表点的聚类算法,提出了自适应谱亲和力传播聚类、基于密度峰值的AP两阶段聚类、基于网格密度的聚类、基于复杂网络社区检测的语义轨迹聚类等多种改进的大规模快速聚类与动态聚类算法;(3)将提出的改进聚类算法应用于健康医疗管理与决策问题,提出了电子病历挖掘中的病人群落识别方法、联合用药群组模块发现方法、典型治疗方案挖掘及评价方法、治疗方案推荐与临床路径发现方法;(4)以临床决策支持为应用背景,提出了多种双边匹配决策、群决策与多属性决策的模型与算法。.完成了50篇高质量的学术期刊论文,其中32篇论文发表在SCI/SSCI收录的重要期刊上,7篇论文为ESI高被引论文,14篇为北大中文核心期刊论文,12篇为CSSCI检索收录论文。申请发明专利1个,软件著作权1个。国际会议大会特邀报告1次,国内会议论坛特邀报告4次,国内会议分组报告1次,主办国内会议一次,参加国际会议3次。荣获辽宁省自然科学学术成果奖三等奖1项,医疗大数据研讨会及Datathon活动二等奖1项,急救大数据研讨会与Datathon活动优胜奖1项。培养出站博士后2名;毕业博士3名;毕业硕士10名。.
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于LASSO-SVMR模型城市生活需水量的预测
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
内点最大化与冗余点控制的小型无人机遥感图像配准
氯盐环境下钢筋混凝土梁的黏结试验研究
时间序列数据挖掘中的聚类模型与算法研究
动态数据挖掘中的演化聚类模型与算法研究
面向临床决策辅助的电子病历文本结构化方法与知识挖掘研究
面向不完备电子病历的属性协同演化约简机理与模型研究