面向医学特定疾病的问题分析和相似度计算模型研究

基本信息
批准号:61772146
项目类别:面上项目
资助金额:67.00
负责人:郝天永
学科分类:
依托单位:华南师范大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:陈仕鸿,瞿瑛瑛,卢达威,王敏,刘罡,徐凯,谢文秀,陈协玲,陈柏宇
关键词:
相似度计算医学问题目标识别问答系统
结项摘要

As an interdisciplinary field between Natural Language Processing and Information Retrieval, Question Answering (QA) has drawn more and more attention and became an emerging research hotspot for providing exact answer service. However, the disease-specific QA research has difficulties due to the complexity of text analysis and information extraction in medical domain. Therefore, targeting at chronic diseases in medical domain, this project carries out fundamental research topics of automatic question answering. With the focus on Diabetes Mellitus, a growing public health problem throughout the world, this project conducts the research on: medical question target identification and classification, medical quantitative statement representation model and extraction method, and question similarity calculation based on question target feature matching and equivalent semantic pattern linking. In addition, the project grabs heterogeneous Diabetes QA pairs and constructs a large scale multi-lingual Diabetes QA corpus for public use, which will eventually serve disease-specific medical QA systems. We believe that the project will be of a positive significance to the basic and practical research on intelligent QA techniques towards major medical diseases, and meanwhile, embodying its social significance and application value to the diabetic in providing treatment information, improving prevention ability of the high-risk population in early-stage, and enhancing daily self-health management.

问答系统以提供精准答案为目标,已成为自然语言处理与信息检索领域的一个重要分支和新兴研究热点。在医学领域中,由于医学文本分析和信息抽取的复杂性,面向医学特定疾病的问答系统研究还存在诸多困难。本项目将围绕医学领域重大慢性疾病,开展医学自动问答的基础科学研究,并以糖尿病这一世界性公共健康问题为出发点,开展医学问题目标的识别与分类方法研究、医学文本数量表达式的表示模型与抽取方法研究、以及基于问题目标特征匹配和等价语义模板关联的医学问题相似度计算模型研究。此外,项目将采集多源异构糖尿病问答数据构建大规模多语言糖尿病FAQ语料库并实现开放使用,最终服务于面向医学特定疾病的自动问答。研究将对面向医学重大疾病的智能问答技术基础研究和实用化研究具有积极的科学意义,并在提供糖尿病人群的防治信息服务、提高糖尿病前期高危人群的预防能力、提升糖尿病患者的自身健康监控等多个方面具有潜在社会意义和应用价值。

项目摘要

由于医学文本分析和信息抽取的复杂性,面向医学特定疾病的问答系统研究还存在诸多困难,本项目围绕医学领域重大慢性疾病,开展医学自动问答的基础和应用科学研究,包括医学问题目标的识别与分类方法、医学非结构化文本的信息抽取方法、医学文本数量表达式的表示与抽取方法、基于问题目标特征匹配和等价语义模板关联的医学问题相似度计算模型、以及领域知识图谱表示学习模型等研究。通过项目的开展,提出了基于混合神经网络的问题目标分类模型、基于深度学习的疾病命名实体抽取方法、基于模式学习的时间表达式抽取方法、基于多模式融合的问答系统框架、融合邻居语义知识的选择对抗网络等新技术、新模型,通过实验对比验证了有效性,并构建一个超过10万问答对的糖尿病常见问题语料库,用于医疗领域问答任务。本项目共计发表30篇学术论文,均为SCI/EI索引(19篇SCI、11篇EI),其中4篇中科院大类一二区论文,并申请了1项ISO国际标准、4项技术发明专利,通过项目研究,培养了20余名博士、硕士、本科生参与课题研究和实践。项目完成并超出了预期的研究目标,对面向医学领域的智能问答技术基础研究和实用化研究具有积极的科学意义和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018

郝天永的其他基金

批准号:61403088
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

空间群组目标相似度计算模型研究

批准号:41201476
批准年份:2012
负责人:刘涛
学科分类:D0115
资助金额:25.00
项目类别:青年科学基金项目
2

结合分布相似和汉语构词特征的词义相似度计算

批准号:61003206
批准年份:2010
负责人:金澎
学科分类:F0211
资助金额:7.00
项目类别:青年科学基金项目
3

基于深度学习的句子相似度计算研究

批准号:61672127
批准年份:2016
负责人:黄德根
学科分类:F0211
资助金额:62.00
项目类别:面上项目
4

基于多关联数据融合的疾病相似度算法研究

批准号:61502125
批准年份:2015
负责人:程亮
学科分类:F0213
资助金额:20.00
项目类别:青年科学基金项目