具有表现力的维吾尔语可视语音合成技术研究

基本信息

批准号：61261037

项目类别：地区科学基金项目

资助金额：43.00

负责人：赵晖

学科分类：

依托单位：新疆大学

批准年份：2012

结题年份：2016

起止时间：2013-01-01 - 2016-12-31

项目状态：已结题

项目参与者：麦热哈巴·艾力,楚发元,开沙尔·卡地尔,于斯音·于苏普,刘小琴,佟磊,麦哈铺热提·外力

关键词：

语音可视化文语转换情感语音合成

结项摘要

Speech and vision are important means of people communicating, and convey people's emotion, attitude, intention, speaking style and other prolific expressiveness.People communication becomes harmonious due to these prolific expressivenesses,which improve the efficiency of communication.This project aims to the research of Expressive Text-to-Visual-Speech synthesis in Uyghur.That is to say,according to the Uyghur text marked expression information,the expressive speech and animated avatar are synthesized which are synchronized and conformed with the Uyghur speech and the Uyghurs' expression.The main research contents include description of Uyghur viseme features,Uyghur text expression tagging methods,speech and facial expressiveness feature denotation and extraction ,Uyghur talking-head synchronized with speech.This research will enrich the theory and methods of Visual-Speech synthesis.In addition,it is significant for entertainment, education,E-commerce and security in Xinjiang. Especially, it has important practical significance to Uyghur television production and distance education. The Uyghur in Xinjiang is extremely similar with nationality in the Middle East and in Southwest Asia，so the research has a great future on application and business,and it's positive to raise the international standing of our country and extend international influence.

语音及视觉特征是人们交流的重要手段，它们传递着情感、态度、意图、说话风格等丰富的表现力信息，正是这些表现力信息，增强了人们对语言的理解,提高了交流的效率。本项目旨在进行文本驱动的有表现力的维吾尔语可视语音合成研究，即让计算机根据标注了表现力信息的维吾尔文文本，合成出同步的、符合维吾尔语语音和维吾尔族表情特点的、有表现力的语音和人脸动画头像。其主要研究内容包括维吾尔语视位特征的定量描述、维吾尔语文本表现力的标注、语音、脸像表现力特征的表示和提取、维吾尔语语音动画头像合成等。本项研究将丰富可视语音合成技术的理论与方法，对于新疆地区的影视娱乐、教育、电子商务、安全等方面具有重要意义，特别是对新疆维吾尔语电视制作和远程教育具有重要现实意义。新疆维吾尔语言与中东地区和中西南亚地区民族语言极度相似，开展这方面的研究具有广阔的应用前景和商业意义，对提高我国国际地位，扩大国际影响力也有不可忽视的积极作用。

项目摘要

语音及视觉特征是人们交流的重要手段，它们传递着情感、态度等丰富的表现力信息，正是这些表现力信息，增强了人们对语言的理解,提高了交流的效率。本项目的主要研究内容包括维吾尔语视位特征的定量描述、维吾尔语文本表现力的标注、语音、脸像表现力特征的表示和提取、维吾尔语语音动画头像合成等。.本项目的主要研究成果包括：第一：定义了维吾尔语元、辅音基本视位集、提出了“复合视位”的概念，建立了便于协同发音控制、具有线性函数特性的分段数学模型，并对所构建的模型，设计了控制参数使各段模型不相互影响，并通过坐标变换，将原空间的曲线拟合参数优化问题转化为线性回归问题，在很大程度上，简化了参数求解过程，并提高了曲线拟合的精度。第二：建立了维吾尔语情感语音语料库，分析了维吾尔语语音情感表现力特征，研究了维吾尔语元音情感特征。该语料库的建立丰富了维吾尔语情感语音语料内容，也是情感语音数据库设计与实现方法的有益补充；基于该语料库关于维吾尔语语音表现力特征的分析、元音情感特征分析是后续有关维吾尔语语音情感计算、语音合成与转换的重要基础。第三：建立了维吾尔语-汉语双语对齐语料，并基于双语对齐语料，提出了基于深度学习算法的维吾尔语情感词典建立方法。维吾尔语-汉语双语对齐语料及情感词典的建立，是维吾尔语文本情感分析的基础。第四：开展了基于维吾尔语语音驱动和文本驱动的唇部动画合成研究，以及情感语音识别与唇声同步研究、维吾尔语情感语音合成与转换研究，设计实现了具有表现力的维吾尔语可视语音合成原型系统。.本项研究丰富了可视语音合成技术的理论与方法，对于新疆地区的影视娱乐、教育、电子商务、安全等方面具有重要意义，特别是对新疆维吾尔语电视制作和远程教育具有重要现实意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.7507/1672-2531.202012076

发表时间：2021

DOI：

发表时间：2019

DOI：10.11844/cjcb.2021.01.0028

发表时间：2021

DOI：10.13550/j.jxhg.20170158

发表时间：2018

DOI：

发表时间：2016

赵晖的其他基金

批准号：11474218

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：61561047

批准年份：2015

资助金额：34.00

项目类别：地区科学基金项目

批准号：41272190

批准年份：2012

资助金额：85.00

项目类别：面上项目

批准号：30973782

批准年份：2009

资助金额：31.00

项目类别：面上项目

批准号：41072125

批准年份：2010

资助金额：50.00

项目类别：面上项目

批准号：81672852

批准年份：2016

资助金额：53.00

项目类别：面上项目

批准号：30960384

批准年份：2009

资助金额：24.00

项目类别：地区科学基金项目

批准号：81473745

批准年份：2014

资助金额：74.00

项目类别：面上项目

批准号：70901007

批准年份：2009

资助金额：18.50

项目类别：青年科学基金项目

批准号：40872108

批准年份：2008

资助金额：42.00

项目类别：面上项目

批准号：31300854

批准年份：2013

资助金额：20.00

项目类别：青年科学基金项目

批准号：81774381

批准年份：2017

资助金额：55.00

项目类别：面上项目

批准号：60962005

批准年份：2009

资助金额：15.00

项目类别：地区科学基金项目

批准号：81403324

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：81201628

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：40401061

批准年份：2004

资助金额：28.00

项目类别：青年科学基金项目

批准号：10904112

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：41771016

批准年份：2017

资助金额：71.00

项目类别：面上项目

批准号：71371028

批准年份：2013

资助金额：56.00

项目类别：面上项目

相似国自然基金

具有表现力的可视语音合成的研究

批准号：60575032

批准年份：2005

负责人：陶建华

学科分类：F0304

资助金额：23.00

项目类别：面上项目

基于多级语音基元及其音律参数的维吾尔语音合成技术研究

批准号：60662002

批准年份：2006

负责人：艾斯卡尔·艾木都拉

学科分类：F0111

资助金额：24.00

项目类别：地区科学基金项目

维吾尔语情感语音合成关键技术研究

批准号：61065005

批准年份：2010

负责人：艾斯卡尔·艾木都拉

学科分类：F0605

资助金额：26.00

项目类别：地区科学基金项目

基于可训练语音基元选择的波形拼接式维吾尔语音合成技术研究

批准号：61062008

批准年份：2010

负责人：古丽娜尔·艾力

学科分类：F0111

资助金额：19.00

项目类别：地区科学基金项目

具有表现力的维吾尔语可视语音合成技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

口腔扁平苔藓研究热点前沿的可视化分析

结合词性、位置和单词情感的内存网络的方面的情感分析

新型冠状病毒与系统损伤研究

固态上转换材料制备及其性能

A Fast Algorithm for Computing Dominance Classes

赵晖的其他基金

有机材料中光电转换过程的动力学研究

基于多语言微博文本的新疆热点事件检测关键技术研究

乌兰布和沙漠晚更新世以来湖泊-沙漠演化过程（侧重释光年代测定与厘清）

益气活血中药联合丰富环境促进脑缺血后神经发生的作用及机制研究

乌兰布和沙漠全新世湖泊-沙漠演化及其释光年代学研究

肿瘤生存微环境中衰老成纤维细胞对结肠癌细胞转移分子调控机制研究

人精液凝固蛋白I小分子衍生肽功能的研究

从功能成像- Rho GTPases信号研究补阳还五汤迭加丰富环境刺激对神经干细胞定向迁移的调控

基于复杂网络理论的城市交通空间结构演化与道路选址方法研究

中国西北季风边缘区全新世干旱事件及其释光年代学

发展性计算障碍的脑功能连接网络特征

多模态影像整合细胞间通讯信息解析补阳还五汤迭加丰富环境刺激对神经机能联系不能的调控作用

基于面部活动单元的新疆维吾尔、哈萨克族表情识别研究

基于SEM全模型和类ROC曲线法对亚健康状态“单证”量化诊断的方法学研究

钙磷蛋白在肺癌骨转移中的功能及作用机制研究

阿拉善高原-黄土高原全新世重大干旱事件(侧重释光年代)研究

一维电声系统的动力学和相图研究

巴丹吉林沙漠西南缘山地洪水补给沙漠地下水的沉积学与年代学证据

城市交通系统中停车换乘设施布局与运营优化研究

相似国自然基金