三维人脸语音相关的形变是真实感人机交互中重要组成部分。广泛应用于可视语音合成和三维人体动画中。该项目致力于语音特定的面部形变机理的研究,结合基于物理的三维人脸静态结构和运动捕捉数据分析语音相关的面部形变机制,构造可视语音单元形变动态模型,分析不同人脸形变风格差异,使动态模型具有一定泛化能力能够适合不同风格人脸语音形变合成。.该研究整合多种来源数据:三维激光扫描获取的人脸表面静态模型、行为捕捉设备获取的面部特征动态轨迹、音频数据流等。建立高精度静态三维人脸模型到稀疏特征动态轨迹的映射,特征动态轨迹流数据和音频信号之间的映射等,构造基本发音单元对应的形变动态模型以及单元之间的转移矩阵,并实现基于音节动态模型的可视语音合成。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于国产化替代环境下高校计算机教学的研究
基于铁路客流分配的旅客列车开行方案调整方法
一种基于多层设计空间缩减策略的近似高维优化方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于多色集合理论的医院异常工作流处理建模
基于深度学习的文本和语音多模态数据挖掘研究
基于多模态观测的跨语言语音发音机理研究
基于面部解剖结构动力学模型与多模态时空数据耦合的人脸仿真
基于语音信号和事件相关电位技术的多模态情感识别研究