基于麦克风阵列的语音增强技术是近年来语音信号处理中的一个研究热点,在通信、语音识别等领域都有广泛的应用价值。本项目针对现有的麦克风阵列语音增强技术对目标说话人的跟踪能力不强、不便于目标说话人的选择等不足,研究一种新的基于声音-视觉声源定位的麦克风阵列语音增强技术,主要研究内容包括:声音、视觉定位算法和麦克风阵列语音增强算法的研究及实现;声音、视觉定位信息的可靠性测度;声音、视觉定位信息的融合模型;声音-视觉声源定位的快速算法;演示系统的建立。本项目的研究涉及到语音信号处理、阵列信号处理、计算机视觉、音视频数据融合等多个学科领域,其研究成果能有效地克服现有单纯基于声音定位的麦克风阵列语音增强技术的一些缺点,因此本项目的研究具有重要的理论意义和实用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于MCPF算法的列车组合定位应用研究
天问一号VLBI测定轨技术
基于暂态波形相关性的配电网故障定位方法
四例Jacob sen综合征胎儿的产前诊断
基于边信息的高光谱图像恢复模型
基于麦克风阵列的语音增强和定位方法研究
基于小型麦克风阵列的声源定位方法研究
虚拟大麦克风阵列的语音增强技术研究
分布式麦克风阵列声源定位算法研究