和谐人机交互技术一直都是人们关注的对象,面向个性化语音的语音转换技术是其重要组成部分,它能够对一个人的声音进行处理,使之变成另一个人的声音,其研究成果对个性化语音生成、人机对话等方向的发展具有重要的意义。而目前已有的语音转换技术一般必须采用文本相关的平行语料来进行训练,对训练数据有着较高的要求,成为制约该技术在实际中应用的重要因素,而采用非平行语料的文本无关技术,是解决这一问题的主要思路。针对这一问题,本项目拟针对非平行语料语音对齐模型、文本无关音色映射模型、融合语音关联信息的韵律转换模型、源说话人无关的语音映射方法等方面进行深入研究,最终形成一个完整和实用的基于非平行语料的文本无关语音转换系统。针对训练数据的准备,研究还将对非平行训练语料的可用性提出评价准则,以方便建立更为实用化的系统。此项研究还对推进语音理解和语言认知的发展将起到重要的作用,有着广阔的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
低轨卫星通信信道分配策略
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
基于端到端深度学习框架的文本无关副语言语音属性识别研究
声纹识别与音频检索耦合的文本无关的多说话人辨认方法研究
傣语文本分析与语音合成研究
耳语讲话中的语音增强与耳语音-正常语音转换研究