Interactive question answering has attracted more and more attentions from researchers as a new generation information technology. Especially, successful systems like Siri and Watson demonstrate the broad development prospects of automatic question answering systems. However, in face of real applications, information access system often need to make full use of information in different forms, structures and sources, the user often ask multiple related questions to obtain more accurate results. In this case, the existing interactive question answering technology is insufficient to obtain satisfying applications. Therefore, this project proposes a real environment oriented interactive question answering model based on heterogeneous information. Firstly, contextual question understanding is implemented to ensure continuous human-machine communication with natural language; second, adaptive models are established to meet the diversified and personalized information needs of the real environment; furthermore, to expand the range of approachable question as well as to improve the answer credibility, massive heterogeneous information are integrated as the search source; besides, multiple model fusion algorithm are exploited to enhance the robustness of key modules for the real question processing; what's more, a answer generation technology is introduced in consideration of completeness, conciseness and coherence, to enhance the interaction naturalness and quality; finally, an objective and quantifiable assessment system is established focusing on interactive process evaluation. The implementation of the project actively promotes the research and application in related areas such as web information processing, human-computer interaction, semantic computation, text clustering and classification.
交互式问答作为新一代信息服务技术越来越受到研究者的广泛关注,尤其是Siri和Watson等系统的成功为人们展示了自动问答系统的广阔发展前景。但在面对真实环境时,往往需要充分利用不同形态、不同结构以及不同来源的信息,用户也会进行多次有关联的提问来获得更加准确的结果,在这种情况下,现有交互式问答技术还难以获得较好应用。为此,本项目提出一种面向真实环境的异构信息交互式问答模型:通过基于上下文语境的问句理解,确保用户以自然语言方式与系统进行连续的信息交流;建立面向真实环境的自适应模型以满足多样化和个性化的信息需求;为扩大解答问题的范围并提高答案可信度,系统采用整合的海量异构信息作为知识源,并利用多模型融合算法提高关键模块对真实问句处理的鲁棒性;同时针对交互过程建立客观、可量化的评测体系。项目的实施将为网络信息处理、人机交互、语义计算、文本聚类与分类等领域的研究与应用起到积极促进作用。
面向真实环境时,问答系统往往需要充分利用不同形态、不同结构以及不同来源的信息,用户也会进行多次有关联的提问来获得更加准确的结果,在这种情况下,现有交互式问答技术还难以获得较好应用。为此,课题组提出了本项目。项目的主要研究内容及相关成果如下:.1. 基于互联网的问答语料库与文本资源构建。课题组在真实的网购环境下,根据买卖双方交易中产生的聊天记录,从中提取出高质量问答对,构建了网络购物问答知识语料库。同时,项目组研究了通过微博构建了百万级短文本文摘语料库。.2. 基于异构信息的关系抽取方法研究。课题组提出了两种基于远距离监督的关系抽取方法,分别进行了实验对比和分析,较以往结果均有了明显的提升,证明了方法的有效性。.3. 基于上下文的问句理解和答案选择方法研究。课题组面向限定领域的交互式问答系统,提出了基于问题分类的用户意图识别模型,对用户的输入进行领域分类,从而能够更准确地理解用户意图。与此同时,课题组提出了使用深度循环卷积神经网络的答案选择模型,该模型充分捕捉到了文本之间的语义关联以及语义关系。.4. 面向上下文语境的感知方法研究。课题组对中文问答系统中的时间敏感问句进行了研究,设计了针对时间敏感问句的识别方法,使得有关时间敏感问句的检索结果平均精度得到了较大改善。.5. 基于深度学习的文本语义匹配方法研究。课题组针对基于深度学习的文本处理方法进行了探索,重点研究了基于卷积神经网络的短文本语义匹配方法,学术成果引起了国内外相关学者的广泛关注。.6. 交互式问答示范系统。课题组设计研发了一款以日常功能性辅助和娱乐聊天类对话为主的智能客服机器人,能够提供日常生活中的便捷问答、金融知识问答、航空自动售票、基于检索的问答服务等功能。.综上,本课按照项目计划的研究方向和内容开展了较为深入的研究工作,共发表了重要国际期刊和会议在内的论文29篇;培养了博士5人,硕士30人;项目按计划完成。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向网络异构信息源的问答资源挖掘
面向交互式问答的省略恢复技术研究
问答式信息检索的理论与方法研究
面向交互式问答的问题理解及问题推荐技术研究