语音是人机交互最为方便直接的方式。有表现力的文语转换技术(Expressive Text-to-Speech Synthesis, E-TTS),除了能让计算机"说出"人类语言外,试图进一步解决言语表达中的"What do you mean by X?"的问题,能够让计算机"绘声绘色"地与人交流。对于E-TTS来说,需要解决两个基本问题:第一、如何获取说话者表达的信息中的表现力;第二、如何建立表现力语音的模型,实现有表现力的语音合成。本研究旨在将文本信息的表现力与表现力语音相结合,研究文语转换系统中文本、语音以及人们表达的情感、态度、意向、说话风格之间的关系,建立文本的语义概念(Semantic Prior)与表现力的联合模型,实现口语对话系统中的E-TTS系统,根据输入文本合成有表现力的语音,进一步提高合成语音的自然度。其研究方法和结果将会对高表现力语音合成有重要的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
货币政策与汇率制度对国际收支的影响研究
高性能汉语文语转换研究
汉语文本分析中语段成分及其作用的研究
具有表现力的维吾尔语可视语音合成技术研究
基于语义分析的汉语文本错误自动侦测与纠错方法