基于可训练语音基元选择的波形拼接式维吾尔语音合成技术研究

基本信息
批准号:61062008
项目类别:地区科学基金项目
资助金额:19.00
负责人:古丽娜尔·艾力
学科分类:
依托单位:新疆大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:库尔班·吾布力,古扎丽努尔·艾木肉拉,买买提·玉苏甫,热合木·马合木提,木合塔尔·艾尔肯,胡什乃再尔·阿尔斯兰,玛依努尔·阿吾力提甫
关键词:
波形拼接合成参数合成维吾尔语统计模型最大似然准则
结项摘要

本项目将参数式语音合成中声学参数的统计建模引入到语音基元挑选与波形拼接式语音合成中, 结合参数式语音合成在自动训练、灵活性和稳定性方面的长处和波形拼接式语音合成在输出语音音质上的优点, 最终在统计建模框架下研究实现基于可训练语音基元挑选和波形拼接的维吾尔语音合成系统关键技术。首先收集覆盖维吾尔语自然语言现象的文本、进行录制和标注,设计上下文属性集和用于决策树建模的训练样本集,规划并建立平滑的声数模型(由基频、时长和谱参数等参数组成)并对其进行聚类,训练决策树模型;对输入的文本进行分析, 得到目标合成句中各个音素的上下文属性,并依此去训练好的模型集合中决策其对应的声学模型, 用基于最大似然准则挑选基元, 经过波形拼接输出合成语音。作为阿勒泰语系语音合成技术研究中的新技术、新方法,其研究成果将对国内阿勒泰语系语言研究高品质、多样化的语音合成系统奠定基础,并将会得到广阔的应用前景。

项目摘要

本项目首先收集了覆盖维吾尔语自然语言现象的文本、进行录制和标注,研究了基于HMM的自动语音切分技术,扩充了原有音库容量,研究了音库无损压缩和实时按需解压算法,设计了上下文属性集和问题集,建立了平滑的语音基元韵律参数模型(由基频、时长和谱参数等参数组成)并对其进行了聚类;对输入的文本进行分析, 得到目标合成句中各个基元的上下文属性,并对其声学模型进行预测, 用最小代价函数挑选基元, 经过波形拼接输出合成语音。作为研究成果进行了2项软件著作权登记,发表论文10篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020

古丽娜尔·艾力的其他基金

相似国自然基金

1

基于多级语音基元及其音律参数的维吾尔语音合成技术研究

批准号:60662002
批准年份:2006
负责人:艾斯卡尔·艾木都拉
学科分类:F0111
资助金额:24.00
项目类别:地区科学基金项目
2

维吾尔语情感语音合成关键技术研究

批准号:61065005
批准年份:2010
负责人:艾斯卡尔·艾木都拉
学科分类:F0605
资助金额:26.00
项目类别:地区科学基金项目
3

具有表现力的维吾尔语可视语音合成技术研究

批准号:61261037
批准年份:2012
负责人:赵晖
学科分类:F0117
资助金额:43.00
项目类别:地区科学基金项目
4

可伸缩中文语音合成系统的研究

批准号:60602017
批准年份:2006
负责人:张巍
学科分类:F0111
资助金额:21.00
项目类别:青年科学基金项目