具有多音素过渡与韵律特征的电子喉元音/辅音异位等效嗓音源合成理论方法与应用实验研究

基本信息
批准号:11274250
项目类别:面上项目
资助金额:85.00
负责人:万明习
学科分类:
依托单位:西安交通大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:吴亮,万聪颖,张红梅,李贤军,张媛媛,闵钰,敬博文,杨妙丽,石季
关键词:
异位等效嗓音源多音素过渡韵律特征电子喉辅音重建
结项摘要

In view of low intelligibility and naturalness of electrolaryngeal speech caused by deficiency of consonant reconstruction and prosodic features, this project is planned to synthesize supra-glottal ectopic equivalent continuous voice source with transition and prosodic features of the phonemes, which will be transmitted into vocal tract with a linear transducer and articulated by reserved vocal tract. The main contents go as follow: 1) Establish physical model for consonant reconstruction and synthetic methods of supra-glottal equivalent voice source for laryngecomees, in order to solve construction problem of consonant for electrolarynx; 2) Improve the established model of supra-glottal vowel voice source, and form a unified theory and method for synthesis of supra-glottal ectopic equivalent vowel/consonant voice source, waveform concatenation, and speech reconstruction; 3) Research the method for synthesis and control of continuous voice source with transition and prosodic features of the phonemes, in order to reconstruct tones, intonation and emotion for electrolaryngeal speech. This project not only develop a new eptopic equivalent voice source for electrolarynx, and can greatly improve the intelligibility and naturalness of electrolaryngeal speech, which is of great significance for the development of voice rehabilitation.

本项目针对电子喉辅音重建与韵律特征缺失造成可懂度和自然度差的问题,提出合成具有多音素过渡和韵律特征的声门上异位等效元音/辅音嗓音源及连续嗓音源,利用线性振动器施加,并与保留完好的构语器官协同发声重建高质量的语音,其主要包括:1)建立喉切除条件下辅音重建的等效物理模型、声门上异位等效辅音嗓音源数学模型与合成理论方法,以解决现有电子喉辅音重建缺失的问题;2)完善我们已经建立的声门上元音嗓音源模型,形成统一的电子喉声门上异位等效元音/辅音嗓音源合成、连续嗓音源拼接理论方法及施加重建技术;3)研究基于多音素过渡与韵律特征的电子喉连续嗓音源合成理论与控制方法,以实现电子喉重建语音声调、语调和情感等特征的表达。本项目不仅发展了电子喉嗓音源的基础理论方法,而且将极大改善电子喉语音的可懂度和自然度,有望推进电子喉语音逼近正常语音。

项目摘要

本项目针对电子喉重建语音,特别是辅音和韵律特征缺失造成的可懂度低和自然度差等问题,研究了具有多音素过渡和韵律特征的电子喉声门上异位等效元音/辅音嗓音源及连续嗓音源合成与控制方法,旨在提高和改善重建语音质量和电子喉交流效率。主要研究内容和重要结果包括:.(1)基于对现有电子喉辅音声学特征和感知听觉特征分析,结合电子喉辅音重建的声学过程,建立了电子喉声门上辅音嗓音源模型与合成方法。研究结果显示该嗓音源能够极大改善电子喉重建语音的质量,特别是消除电子喉辅音浊音化,提高重建辅音的可懂度。.(2)完善了电子喉声门上元音嗓音源模型与合成方法,并且基于视频的模式识别方法实现了电子喉嗓音源的自动合成控制,为应用于日常电子喉语音交流提供了可能。研究表面,该电子喉嗓音源与控制方法能够在提高电子喉元音可懂度的基础上满足日常语音交流的需要。.(3) 针对韵律特征和连续语音重建,研究了基于频率变化的电子喉汉语声调重建方法、基于辅-元结构的连续嗓音源合成方法、以及基于肌肉电信号的嗓音源控制合成方法。在实验证实方法有效性的基础上,所有方法均已集成于电子喉语音交流系统。.(4)从能量角度出发,建立了电子喉语音发声效率基本理论和测量方法,实现了对电子喉重建过程的系统评价,揭示了电子喉语音重建中存在的电机转换效率和组织耦合效率低的问题,为电子喉重建技术改进提供了依据。.本项目研究建立的基本理论与关键技术不仅改善了电子喉重建语音的质量和提高了可懂度,而且通过系统开发建立应用于日常交流的电子喉语音交流系统,为技术转化和实际应用奠定了基础,为进一步改善喉切除患者生活质量提供了可能。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

空气电晕放电发展过程的特征发射光谱分析与放电识别

空气电晕放电发展过程的特征发射光谱分析与放电识别

DOI:10.3964/j.issn.1000-0593(2022)09-2956-07
发表时间:2022
5

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021

万明习的其他基金

批准号:39470212
批准年份:1994
资助金额:8.00
项目类别:面上项目
批准号:10874137
批准年份:2008
资助金额:38.00
项目类别:面上项目
批准号:39970208
批准年份:1999
资助金额:14.00
项目类别:面上项目
批准号:30570487
批准年份:2005
资助金额:25.00
项目类别:面上项目
批准号:39570217
批准年份:1995
资助金额:9.00
项目类别:面上项目
批准号:30630024
批准年份:2006
资助金额:135.00
项目类别:重点项目
批准号:69101002
批准年份:1991
资助金额:4.70
项目类别:青年科学基金项目
批准号:81771854
批准年份:2017
资助金额:55.00
项目类别:面上项目
批准号:30270404
批准年份:2002
资助金额:24.00
项目类别:面上项目

相似国自然基金

1

基于面部和喉部运动特征动态调节的咽腔电子“喉”理论方法与应用实验研究

批准号:10874137
批准年份:2008
负责人:万明习
学科分类:A2305
资助金额:38.00
项目类别:面上项目
2

电子喉嗓音源发声神经肌肉系统动态合成及其语音增强与缺失补偿研究

批准号:30770544
批准年份:2007
负责人:王素品
学科分类:C1005
资助金额:30.00
项目类别:面上项目
3

话语结构、信息与韵律特征

批准号:39970254
批准年份:1999
负责人:杨玉芳
学科分类:C0907
资助金额:12.00
项目类别:面上项目
4

面向语音合成的维吾尔语韵律特征及其建模方法研究

批准号:61063023
批准年份:2010
负责人:地里木拉提·吐尔逊
学科分类:F0211
资助金额:25.00
项目类别:地区科学基金项目