In this study, the electronic medical records (EMR) of Chinese medicine will be used as research object. The data will be processed by algorithms based on the Deep Learning model composed of Unsupervised Learning for labelled small samples and Supervised Learning for unlabeled big data. The EMR data on hypertension and cervical spondylosis will be used as study objects in order to assess the feasibility and practicability of the Deep Learning model for EMR data analysis for Chinese Medicine. And we will develop to core technology based on information retrieval for TCM. It is hopeful to overcome the demerits in TCM clinical research methodology such as insufficient sample, data complexity and inconsistency. A novel research approach based on EMR data mining and informatics can be developed based on IT technologies such as health informatics, information retrieval, and big data analysis. As a result, the clinical study of Chinese Medicine will be transferred from the conventional “hypothesis—test” paradigm to the new data mining paradigm. This study aims to explore the latent knowledge in Chinese medicine, and to uncover the complex relations among the diagnosis and treatment procedure of TCM practice, so that a new methodology and a new series of technology will be introduced to the research methodology of Chinese medicine. A serial of core algorithms and programs with their source code will be developed during the research, which can be applied to a variety of clinical support systems and diagnosis assistance systems based on information retrieval and data mining. Therefore, the research will initiate an innovation for TCM research methodology and technology.
本项目以中医电子病案数据为研究对象,通过构建面向以有标引的小样本的无监督学习(Unsupervised Learning)和面向未标引的大数据的监督学习(Supervised Learning)相结合的深度学习(Deep Learning)模型,通过对高血压和颈椎病两个病种的临床诊疗大数据分析,以探索评价深度学习在中医临床信息挖掘的实用性,形成深度学习的医学信息提取共性技术,克服临床试验样本量不足,难以分析多元复杂关系等方法学不足,以探索通过EMR进行临床诊疗效果评价的新方法和新途径。应用健康信息学技术、信息提取技术和大数据分析技术,实现中医临床数据分析从传统的“假说-验证”法向数据挖掘法的转变。为探索中医临床中等隐含知识,揭示中医个体化辨证论治过程的复杂联系提供新的思路和技术实现手段,在研究中实现中医研究方法学和技术创新。
深度学习是目前人工智能领域最先进的机器学习算法。深度学习采用多种方式来表示数据特征,并具有自动提取数据特征的能力,可采用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征,能够更容易从实例中学习任务,至今已有数种深度学习框架,如深度神经网络、卷积神经网络和深度置信网络和循环神经网络已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。本项目旨在探索深度学习算法在中医信息提取上的应用前景。以包括数字数据,文本数据,图像数据等电子病案资料为研究对象,应用深度神经网络模型,采用监督学习和无监督学习相结合的方法,形成了基于网络深度置信网络(deep belief networks,DBN)的中医疗效数据识别预测技术,基于深度卷积神经网络(Deep Convolutional Neural Network, DCNN)的医学图像特征学习与识别技术,基于分布式语意算法(Distributional Semantic Algorithm)和长短记忆网络(Long Short-term Memory, LSTM)的医学语意识别技术,为构建面向中医大数据的人工智能和机器学习研究奠定了基础研究基础。.在具体研究实施过程中,课题组和美国NIH开展合作,使用DCNN技术成果实现了对疟疾感染红细胞的自动化识别和基于人工智能的早期筛查技术,识别正确率超过96%;应用DBN技术对针灸治疗慢性颈痛的疗效评价数据进行机器学习和自动预测;应用基于分布式语义算法的词向量(Word2Vec)模型对登革热登记数据库行实现语义表示和语意相似度匹配,以提取语义特征用于人工智能的语义识别,通过相似度计算自动辨识病人特征,正确率达86%。.在本项目执行过程中,课题组共取得相关研究成果21项,包括期刊论文5篇(均标注研究项目号),被科学索引(SCI)收录4篇,其中以课题负责人为第一作者4篇,课题主要参与人为第一作者1篇。会议论文9篇,被工程索引(EI)收录7篇,其中以课题负责人为第一作者6篇,课题主要参与人为第一作者3篇。另外取得发明专利4项,软件著作版权2项。完成培养硕士研究生1人次。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
基于深度学习的人脸识别关键技术研究
基于深度学习的高分遥感图像解译关键技术研究
基于深度学习的水下复杂环境感知关键技术研究
基于深度学习的空管指挥安全监控关键技术研究