Death number of liver cancer in China accounted for the global death toll of 51%, which is substantial economic burden for both patients and government. Limited by the diagnostic methods, patients with liver cancer are likely to be diagnosed with symptoms of advanced disease. Therefore, early diagnosis using informative examination, such as radiological examination, is necessary. However, radiological diagnosis relays on individual clinician's experience, leading to limited accuracy and efficiency. As the development of clinical health big data, applying artificial intelligence methods on medical text processing becomes feasible. This project plans to use deep learning and other artificial intelligence methods to design un-supervised Chinese word segmentation method, vector representation algorithm and build liver cancer assisted diagnosis model using radiological reports. This project aims to change live cancer diagnose method from depending on individual clinician's experience to using assisted diagnosis model. Assisted diagnosis and natural language processing methods in this project could be easily promoted to other diseases. This project has both theoretical and practical significance on medical resources optimization, clinical work less, diagnosis accuracy and efficiency improvement.
我国肝癌死亡人数占全球的51%,这种严峻形势为社会带来了沉重的负担。受限于目前的诊疗手段,肝癌患者确诊时多处于进展期或晚期,因此实现肝癌的早期精确诊断意义重大。影像学检查为常见的肝癌早期检查方式,目前影像学报告的诊断依靠医生的临床经验,效率和准确率受限。在医疗健康大数据的背景下,将人工智能方法应用于影像学报告等医疗文本的自然语言处理研究中是非常必要和迫切的。针对基于肝癌影像学报告的疾病预测问题,本项目使用深度学习等人工智能算法,分析影像学报告,设计中文非监督学习分词算法和基于深度学习的医疗文本向量化表示算法,最终建立肝癌辅助诊断模型。该模型使影像学诊断从依靠医生的经验转换为使用人工智能的方法,并且后续可推广至其他疾病的辅助诊断问题和医疗文本自然语言处理问题中。本项目在优化分配医疗资源、减轻医生工作量、提高肝癌诊断准确率和效率等方面具有重要的理论和现实意义。
影像学检查为常见的肝癌早期检查方式,目前影像学报告的诊断依靠医生的临床经验,效率和准确率受限。在医疗健康大数据的背景下,将人工智能方法应用于影像学报告等医疗文本的自然语言处理研究中是非常必要和迫切的。健康医疗大数据主要有患者基本信息、电子病历、诊疗数据、检验数据等,具有数据规模大、结构多样性、数据增长快等特点,可以帮助人们更好的理解疾病发生的机理、寻找更好的治疗路径。本项目基于自然语言处理(natural language processing, NLP),使用深度学习算法BERT-BiLSTM-CRF分析肝癌影像学报告数据,对其设计中文分词、实体识别等自然语言处理流程,将影像学报告转化为结构化的文本特征,并之后使用深度学习算法设计辅助诊断模型。该自然语言处理流程之后可延伸应用于多类医学文本及其他疾病的辅助诊断中。本课题共收集了中文CT影像学报告,提取了两类影像学特征:基于已有医学知识的“快进”、“快出”特征,和基于影像学报告内容的特征。在中文影像学报告的特征提取中,我们同时引入了基于已有医学知识的特征和基于已有影像学报告内容的特征,并且通过深度学习算法能有效提高特征提取准确率。两类特征的共同使用,也可以进一步提高疾病预测模型的准确率。该自然语言处理流程为中文医学语言处理提供了研究思路,并且为人工智能算法在影像学报告中的文本研究提供了理论基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
结核性胸膜炎分子及生化免疫学诊断研究进展
Cupriavidus pinatubonensis JMP134中H2S氧化代谢途径的调控机理研究
基于深度学习的海量影像文本报告与医学图像复合信息挖掘
基于影像组学异构多模态数据的深度迁移学习混合模型方法研究
基于影像组学和深度学习的自发性脑出血智能预后预测研究
基于深度学习的癫痫多模态脑影像分类研究