面向问答系统的多维语义模板研究

基本信息
批准号:61403088
项目类别:青年科学基金项目
资助金额:25.00
负责人:郝天永
学科分类:
依托单位:广东外语外贸大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:丘心颖,申宇铭,郑琪,刘罡,瞿瑛瑛
关键词:
多维语义模板常问问题检索动态学习知识表示问答系统
结项摘要

Automated question answering (QA) is an important branch of information retrieval area and a newly emerging hot research field. Nevertheless, current QA systems still have certain problems such as the difficulty of question analysis, the low accuracy of answer retrieval, etc. Particularly, a large number of accumulated questions/answers as a resource were partially wasted due to low reuse rate in user-interactive QA systems. Based on the investigation on improving answer accuracy utilizing semantic pattern, the project aims to improve question analysis and resource reuse from the point of view of intelligent information processing, targeting for the scientific problems in QA research area. The research topics include: Multi-dimensional semantic pattern modeling and its automated generation; Question categorization, similar/relevant question determination and retrieval; Answer retrieval from frequently asked questions using multi-dimensional semantic pattern; dynamic online incremental semantic pattern learning. In general, the project will conduct research on the multi-dimensional semantic pattern by integrating syntactic analysis, semantic analysis, knowledge representation, and dynamic learning methods, for providing a new solution to current QA research. The project is also expected to promote both theory and application development of the intelligence for QA systems.

问答系统是信息检索领域的一个重要分支和新兴的研究热点,但目前仍存在问题分析困难、答案抽取精度低等诸多问题,尤其是在用户交互问答系统中,大量积累的问答数据资源没有得到有效重用而产生了极大的浪费。本项目在深入调研利用语义模板提高答案精度的基础上,针对目前问答系统中存在的关键科学问题,从智能信息处理的角度出发,围绕问题分析和资源重用展开研究。主要研究内容包括:多维语义模板的模型定义和自动生成、基于多维语义模板的问题自动分类、相似问题和相关问题的判定和检索、常问问题答案抽取、模板的动态增量学习。研究将深入结合语法分析、语义分析、知识表示、动态学习等多种方法,构建适合问答系统的新型多维语义模板模型,提高问答数据的语义分析能力和答案抽取的精度,有效的重用数据资源,为问答系统研究提供新的解决方法,这对推动问答系统的智能化研究与发展具有重要的理论意义和应用价值。

项目摘要

问答系统是信息检索领域的一个重要分支和新兴的研究热点,但目前仍存在问题分析困难、答案抽取精度低等诸多问题,尤其是在用户交互问答系统中,大量积累的问答数据资源没有得到有效重用而产生了极大的浪费。基于此,本项目重点开展了:面向问答系统的问题目标识别与分类研究、语义模板模型和问答数据重用方法研究、面向问答系统的问题表示模型研究、问答系统中相似问题的自动识别方法研究、面向大规模文本数据的信息抽取研究、问答数据中用户兴趣主题的自动发现方法研究。通过本项目的实施,产出了丰富的科研成果。在学术创新研究方面,提出了一种新的结合语义和模板的问题表示模型,通过问题目标的识别和分析、自动语义标注、模板匹配等实现问答数据的匹配,有利于提高问题表示和处理的效率和性能;提出了一种基于语义扩展的问题目标识别和分类方法,该方法与现有方法的对比中取得了最好实验效果,研究有利于促进精准问题目标识别;提出了一种从异构文本数据中挖掘语义标签的方法,该方法有利于提高问答系统在问题分析、答案抽取上的语义分析能力;提出了一种新的辅助问答数据重用的问题表示模型,模型通过定义三种问题词型和一种语义模板来分析问题,其中包括问题目标的分类信息,通过与现有常用方法的对比取得了最好的精度,验证了方法的有效性,对大规模问答数据重用具有理论和应用价值。本项目共计发表英文学术论文18篇(第一或通讯作者),其中SCI索引5篇、EI索引13篇;构建了多个原型系统并经过了初步验证;通过项目组成员的分工与合作,培养了1名博士生、3名硕士生、10多名本科生参与课题研究,锻炼了学生的科研能力和系统开发能力。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

复杂系统科学研究进展

复杂系统科学研究进展

DOI:10.12202/j.0476-0301.2022178
发表时间:2022
3

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
4

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020
5

末次盛冰期以来中国湖泊记录对环流系统及气候类型的响应

末次盛冰期以来中国湖泊记录对环流系统及气候类型的响应

DOI:DOI: 10.11821/dlxb201611003
发表时间:2016

郝天永的其他基金

相似国自然基金

1

基于粒计算与语义模板的问答系统研究

批准号:61305094
批准年份:2013
负责人:徐菲菲
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
2

面向Wiki的多维动态语义计算模型及关键技术研究

批准号:61070202
批准年份:2010
负责人:冯志勇
学科分类:F0207
资助金额:32.00
项目类别:面上项目
3

基于大数据深度语义表示学习的农业智能问答研究

批准号:31771677
批准年份:2017
负责人:陈雷
学科分类:C1301
资助金额:62.00
项目类别:面上项目
4

面向高可靠的开放域问答研究

批准号:61902381
批准年份:2019
负责人:范意兴
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目