本项目研究基于麦克风阵列的多说话人跟踪方法,它在多媒体通信、人机接口等领域有广泛应用价值。主要研究内容为:(1) 应用矩阵理论中的盖氏(Gerschgorin)圆估计方法,构造信号源数的判决准则,进行说话人数目的有效估计;研究麦克风阵列的拓扑结构;(2) 应用高分辨率空间谱估计理论,根据语音信号的特点,研究多说话人的声源定位方法;(3) 应用非线性Kalman滤波技术和Bayes递推滤波技术,研究说话人跟踪的非线性滤波方法,进一步提高跟踪系统的性能;(4) 考虑到说话人运动模型的多样性,应用多传感器多目标跟踪中的数据融合算法,进行多说话人跟踪方法的研究;(5) 基于随机集合理论,研究说话人数目变化情况下的多说话人跟踪方法;(6) 在高速DSP上建立基于麦克风阵列的多说话人跟踪实时处理系统。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
基于分布式麦克风阵列的多说话人跟踪方法研究
基于分布式麦克风阵列的说话人定位与跟踪方法研究
基于麦克风阵列的移动机器人实时声源定位方法研究
基于小型麦克风阵列的声源定位方法研究