Human-computer conversation systems have attracted more and more attention due to their promising potentials and alluring commercial values as a life companion for humans. As is well-known, human conversations are highly diverse and quite flexible. However, the existing human-computer conversational systems cannot control contents and styles in dialogues. Hence, it is infeasible for computers to mimic human utterances or eventually speak like humans. In the meanwhile, inappropriate evaluation metrics impede the development of human-computer conversation techniques. To this end, it is necessary to build a new conversation paradigm with controllable mechanisms to solve the mentioned problems..For the first time, we propose a controllable paradigm for human-computer conversational systems, and design corresponding evaluation metrics so as to maintain a conversational platform. In this proposal, we learn human utterances from massive human-human conversations through deep neural networks and empower the system with capabilities to converse. To be more specific, we pay great attentions on 1) the controllable mechanism in contents during the generation process, including constrain and multi-constrain, and 2) the controllable mechanism in styles, including emotions and persona. In this way, the conversational systems would be more human-like. We also propose new evaluation metrics to measure the performance of conversational systems so that we can greatly advance human-computer conversations.
开放领域的人机对话系统作为人们的生活伴侣,获得了人们越来越多的关注。然而,对话具有多样性和灵活性等特征,但现有的人机对话系统缺乏对内容和风格的控制,并不能够模拟甚至替代人类对话,从而无法达到预期。同时,不合理的对话评价标准,进一步阻碍了人机对话技术的发展。因此,迫切需要一套可控的对话生成及评测系统来解决上述问题。.本课题将首次给出控制式生成对话解决方案,并针对对话系统设计一套专门的评测体系。本课题拟使用深度学习的方法,使得系统通过对大量人-人对话样本的学习,具有自然的对话能力。在此基础上,本课题着重研究对话生成过程中,1)对生成结果进行内容控制,包括单限制词和多限制词,以及 2)对生成结果进行风格控制,包括个性化和情感,使得对话系统更加人性化。以上述生成系统为依托,本课题进一步提出人机对话系统的评价方式,从而推动对话系统的发展。
人机对话图灵测试被认为是人工智能应用的终极挑战之一,智能对话系统作为人们生活的伴侣,逐渐获得了越来越多的重视与关注。本项目获取互联网上的海量人-人对话语料作为数据基础,采用统计机器学习与深度学习方法,学习人与人的对话交互模式,萃取人与人的对话知识信息,借鉴人与人的对话评价机制,并针对人机对话系统的技术特点,研究了对话回复的选择与生成策略,搭建了基于自然语言的人机对话系统平台。项目课题组着力解决了对多轮人机对话的上下文建模机制,包括历史对话信息,以及可能的未来对话预期,实现了对当前对话输入语句的丰富建模方案。此外,项目课题组特别研究了如何将知识信息融合进入到当前的对话流程中,例如对话的情感特征,对话个性化内容,对话风格属性,以及对话依赖的外部知识,包括但不仅限于常识信息与文本知识集合等等。项目收集了超过1000万条对话语料,通过多种模式增强对话数据,优化对话模型以及设计对话评测机制,实现了平台的系统融合。项目课题组提出的人机对话技术、模型、方法在多项国际权威通用数据集上取得了较好的成绩,并在多个企业级的实际对话系统产品中得到效果的应用与验证,取得了较好的业务收益。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
拥堵路网交通流均衡分配模型
中国参与全球价值链的环境效应分析
开放领域人机对话技术研究
开放式云平台中基于跨域用户的数据隐私保护技术
深海浮式平台Laplace域动力分析方法研究及系统构建
基于语义图生成的开放域语义解析关键技术研究