面向高可靠的开放域问答研究

基本信息
批准号:61902381
项目类别:青年科学基金项目
资助金额:26.00
负责人:范意兴
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
Web信息检索开放域问答可解释性高可靠
结项摘要

In recent years, due to the explosive growth of Internet data, the rapid improvement of hardware computing ability and the great progress of natural language processing and deep learning technology, intelligent question-and-answer method has made rapid progress in recent years. With the popularity of smart phones and the wide application of various intelligent assistants, the open-domain question answering system draws close to the people's daily life even more, and the demand is gradually increasing. Therefore, it has become an exigent task to build a reliable and secure system. In fact, there are several key challenges in open-domain question answering: Firstly, the forms and intentions of the questions vary significantly across different questions. Secondly, the answer to the question is of great uncertainty as many of the question often have no answers. Thirdly, it requires the answers able to be interpreted especially for those high-risk questions. In this proposal, we focus on the following three research questions: deep semantic question understanding, robust answer generation, and visual evidence inference and interpretation. In this way, we aim to establish the basic theory and key technologies for a highly reliable Open-domain question answering system.

近年来,由于互联网数据的爆发式增长、硬件计算能力的飞速提高以及自然语言处理和深度学习技术的长足进步,智能问答方法在近年来取得了突飞猛进的发展。随着智能手机的普及以及各类智能助手的广泛应用,开放域的智能问答系统也越来越贴近人们的生活,人们对于问答系统的依赖性也逐渐增强,因此构建安全可靠的问答系统是一个迫切需要解决的问题。事实上,在开放域问答中存在着几个关键特性:首先,问题的形式多变且意图具有多样性;其次,问题答案存在不确定性;再次,高风险问题答案的可解释性。这些特性为高可靠问答系统的构建带来严峻的挑战。针对该问题,本项目围绕开放域问答中深层次的问题语义理解、鲁棒性的问题答案生成、以及可视化的证据推断解释三个方面展开研究,旨在建立面向高可靠的开放域问答成体系的基础理论和关键技术。

项目摘要

针对开放域问答系统在实际应用中面临的问题形式多变与意图多样、问题答案不确定以及答案缺乏可解释的挑战,本项目致力于面向高可靠的开放域问答技术研究,实现意图理解、模型构建以及答案生成三个层面的技术突破,解决开放域问答在问题意图深度理解、匹配模型鲁棒构建以及答案可解释生成上的关键科学问题。本项目从如下四个方面展开研究工作,并取得了一系列原创性的理论与技术成果,具体包括:(1)基于对比式的查询意图理解与表示学习:为了支撑面向复杂检索意图的查询理解与表示,我们主要研究了对比式查询意图生成、基于语义代表性的预训练检索模型以及基于描述的实体分布语义表示;(2)鲁棒可靠的问答匹配模型构建:为了保障问答匹配模型的可靠性,我们主要研究了神经检索模型训练中的标注偏差纠正、基于标签分布增强的极大似然估计方法以及阅读理解模型的持续领域适配;(3)可解释的模型理解与答案生成:为了支撑模型的可解释理解和答案的可解释生成,我们主要研究了相关性匹配模型的深度分析与理解、基于对抗攻击的神经检索模型脆弱性分析、开放域问答系统中的答案可信性研究,以及面向事实验证的生成式证据检索;除了上述的研究成果外,我们还将项目中形成的理论方法成果整合发布成了开源深度文本匹配工具MatchZoo,同时还集成了当前信息检索领域最佳的文本匹配模型,验证了模型的有效性和可用性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
2

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021
3

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021
4

采煤工作面"爆注"一体化防突理论与技术

采煤工作面"爆注"一体化防突理论与技术

DOI:10.13247/j.cnki.jcumt.001297
发表时间:2021
5

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017

范意兴的其他基金

相似国自然基金

1

开放域问答式信息检索技术研究

批准号:60203020
批准年份:2002
负责人:刘挺
学科分类:F0211
资助金额:15.00
项目类别:青年科学基金项目
2

受限域汉语问答系统研究

批准号:60663004
批准年份:2006
负责人:余正涛
学科分类:F0211
资助金额:7.00
项目类别:地区科学基金项目
3

面向开放域知识网络的实体语义关系抽取方法研究

批准号:61672057
批准年份:2016
负责人:冯岩松
学科分类:F0211
资助金额:62.00
项目类别:面上项目
4

面向开放域数据的情报知识图谱构建技术研究

批准号:U1836108
批准年份:2018
负责人:刘建毅
学科分类:F0202
资助金额:66.00
项目类别:联合基金项目