As an interdisciplinary field between Natural Language Processing and Information Retrieval, Question Answering (QA) has drawn more and more attention and became an emerging research hotspot for providing exact answer service. However, the disease-specific QA research has difficulties due to the complexity of text analysis and information extraction in medical domain. Therefore, targeting at chronic diseases in medical domain, this project carries out fundamental research topics of automatic question answering. With the focus on Diabetes Mellitus, a growing public health problem throughout the world, this project conducts the research on: medical question target identification and classification, medical quantitative statement representation model and extraction method, and question similarity calculation based on question target feature matching and equivalent semantic pattern linking. In addition, the project grabs heterogeneous Diabetes QA pairs and constructs a large scale multi-lingual Diabetes QA corpus for public use, which will eventually serve disease-specific medical QA systems. We believe that the project will be of a positive significance to the basic and practical research on intelligent QA techniques towards major medical diseases, and meanwhile, embodying its social significance and application value to the diabetic in providing treatment information, improving prevention ability of the high-risk population in early-stage, and enhancing daily self-health management.
问答系统以提供精准答案为目标,已成为自然语言处理与信息检索领域的一个重要分支和新兴研究热点。在医学领域中,由于医学文本分析和信息抽取的复杂性,面向医学特定疾病的问答系统研究还存在诸多困难。本项目将围绕医学领域重大慢性疾病,开展医学自动问答的基础科学研究,并以糖尿病这一世界性公共健康问题为出发点,开展医学问题目标的识别与分类方法研究、医学文本数量表达式的表示模型与抽取方法研究、以及基于问题目标特征匹配和等价语义模板关联的医学问题相似度计算模型研究。此外,项目将采集多源异构糖尿病问答数据构建大规模多语言糖尿病FAQ语料库并实现开放使用,最终服务于面向医学特定疾病的自动问答。研究将对面向医学重大疾病的智能问答技术基础研究和实用化研究具有积极的科学意义,并在提供糖尿病人群的防治信息服务、提高糖尿病前期高危人群的预防能力、提升糖尿病患者的自身健康监控等多个方面具有潜在社会意义和应用价值。
由于医学文本分析和信息抽取的复杂性,面向医学特定疾病的问答系统研究还存在诸多困难,本项目围绕医学领域重大慢性疾病,开展医学自动问答的基础和应用科学研究,包括医学问题目标的识别与分类方法、医学非结构化文本的信息抽取方法、医学文本数量表达式的表示与抽取方法、基于问题目标特征匹配和等价语义模板关联的医学问题相似度计算模型、以及领域知识图谱表示学习模型等研究。通过项目的开展,提出了基于混合神经网络的问题目标分类模型、基于深度学习的疾病命名实体抽取方法、基于模式学习的时间表达式抽取方法、基于多模式融合的问答系统框架、融合邻居语义知识的选择对抗网络等新技术、新模型,通过实验对比验证了有效性,并构建一个超过10万问答对的糖尿病常见问题语料库,用于医疗领域问答任务。本项目共计发表30篇学术论文,均为SCI/EI索引(19篇SCI、11篇EI),其中4篇中科院大类一二区论文,并申请了1项ISO国际标准、4项技术发明专利,通过项目研究,培养了20余名博士、硕士、本科生参与课题研究和实践。项目完成并超出了预期的研究目标,对面向医学领域的智能问答技术基础研究和实用化研究具有积极的科学意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
涡度相关技术及其在陆地生态系统通量研究中的应用
拥堵路网交通流均衡分配模型
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
卫生系统韧性研究概况及其展望
空间群组目标相似度计算模型研究
结合分布相似和汉语构词特征的词义相似度计算
基于深度学习的句子相似度计算研究
基于多关联数据融合的疾病相似度算法研究