基于麦克风阵列的语音增强技术是近年来语音信号处理中的一个研究热点,在通信、语音识别等领域都有广泛的应用价值。本项目针对现有的麦克风阵列语音增强技术对目标说话人的跟踪能力不强、不便于目标说话人的选择等不足,研究一种新的基于声音-视觉声源定位的麦克风阵列语音增强技术,主要研究内容包括:声音、视觉定位算法和麦克风阵列语音增强算法的研究及实现;声音、视觉定位信息的可靠性测度;声音、视觉定位信息的融合模型;声音-视觉声源定位的快速算法;演示系统的建立。本项目的研究涉及到语音信号处理、阵列信号处理、计算机视觉、音视频数据融合等多个学科领域,其研究成果能有效地克服现有单纯基于声音定位的麦克风阵列语音增强技术的一些缺点,因此本项目的研究具有重要的理论意义和实用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
基于SSVEP 直接脑控机器人方向和速度研究
低轨卫星通信信道分配策略
连续视程人工晶状体植入术后残余散光对视觉质量的影响
倒装SRAM 型FPGA 单粒子效应防护设计验证
基于麦克风阵列的语音增强和定位方法研究
基于小型麦克风阵列的声源定位方法研究
虚拟大麦克风阵列的语音增强技术研究
分布式麦克风阵列声源定位算法研究