基于分布式麦克风阵列的说话人定位与跟踪方法研究

基本信息
批准号:61172110
项目类别:面上项目
资助金额:63.00
负责人:殷福亮
学科分类:
依托单位:大连理工大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:高大鹏,汪林,杨磊,田野,刘洋,孙少雄,王舒文,彭钰林
关键词:
非线性滤波说话人跟踪分布式麦克风阵列声源定位
结项摘要

本项目研究基于分布式麦克风阵列的说话人定位与跟踪方法,它在多媒体通信、人机接口、机器人、军事等领域有广泛应用价值。主要研究内容为:(1)应用最大似然等理论,研究分布式麦克风阵列的校准方法,有效地估计麦克风阵列的几何位置;(2)应用无导师聚类方法和矩阵理论中的盖氏(Gerschgorin)圆估计方法,构造语音信号源数的判决准则,进行说话人数目的估计;(3)应用随机集合理论和模糊K均值聚类方法,识别和选择能提供有效信息的最佳节点麦克风,以减少计算复杂度;(4)考虑到分布式麦克风阵列位置的估计误差,研究稳健的时延估计方法,并用总体最小二乘和最大似然理论,研究说话人定位方法;(5)考虑到说话人运动模型和分布式阵列的特点,用多传感器多目标跟踪中的数据融合算法,采用分布式非线性Kalman滤波和Bayes递推滤波技术,研究说话人跟踪方法;(6)建立基于分布式麦克风阵列的说话人定位与跟踪实时处理系统。

项目摘要

分布式麦克风阵列具有易于安装布置、对阵列拓扑结构限制少等优点,近年来已成为语音处理领域的研究热点,并在多媒体通信、人机交互、安全监控、机器人导航等领域有广阔应用前景。. 本项目对基于分布式麦克风阵列的说话人定位与跟踪方法进行了深入研究,主要成果有:(1)研究了基于分布式麦克风阵列的说话人定位方法,包括基于麦克风聚类和神经网络的声源定位方法、基于位置指纹和高斯混合递归的声源定位方法、基于支持向量机的双耳声源定位方法、基于小波变换和语音包络的时间延迟估计方法等;(2)研究了基于卡尔曼滤波的分布式麦克风阵列说话人跟踪方法,包括基于分布式卡尔曼滤波的说话人跟踪方法、基于分布式交互多模型-无轨迹卡尔曼滤波的说话人跟踪方法、基于分布式迭代扩展卡尔曼滤波的说话人跟踪方法;(3)研究了基于粒子滤波的分布式麦克风阵列说话人跟踪方法,包括基于分布式粒子滤波的说话人跟踪方法、基于总体相干场与分布式粒子滤波的说话人跟踪方法、基于分布式辅助粒子滤波的说话人跟踪方法、基于分布式边缘辅助粒子滤波的说话人跟踪方法、基于数值积分卡尔曼粒子滤波的说话人跟踪方法、非高斯噪声环境下基于分布式粒子滤波的说话人跟踪方法等;(4)研究了基于随机有限集理论的麦克风阵列说话人跟踪方法,包括基于数值积分卡尔曼-概率假设密度滤波的多说话人跟踪方法、基于中心差分卡尔曼-概率假设密度滤波的多目标跟踪方法、基于高斯混合概率假设密度滤波的主用户跟踪方法等;(5)研究了基于声能量衰减模型和时间延迟估计的分布式麦克风阵列校准方法;(6)建立了分布式麦克风阵列说话人定位与跟踪系统。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
2

带有滑动摩擦摆支座的500 kV变压器地震响应

带有滑动摩擦摆支座的500 kV变压器地震响应

DOI:10.13336/j.1003-6520.hve.20200528028
发表时间:2021
3

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
4

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
5

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020

殷福亮的其他基金

批准号:60372082
批准年份:2003
资助金额:22.00
项目类别:面上项目
批准号:60772161
批准年份:2007
资助金额:25.00
项目类别:面上项目
批准号:61771091
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:60172073
批准年份:2001
资助金额:3.00
项目类别:面上项目

相似国自然基金

1

基于分布式麦克风阵列的多说话人跟踪方法研究

批准号:61771091
批准年份:2017
负责人:殷福亮
学科分类:F0117
资助金额:62.00
项目类别:面上项目
2

基于麦克风阵列的多说话人跟踪方法研究

批准号:60772161
批准年份:2007
负责人:殷福亮
学科分类:F0111
资助金额:25.00
项目类别:面上项目
3

分布式麦克风阵列声源定位算法研究

批准号:60940007
批准年份:2009
负责人:张一闻
学科分类:F0111
资助金额:10.00
项目类别:专项基金项目
4

基于麦克风阵列的移动机器人实时声源定位方法研究

批准号:61340046
批准年份:2013
负责人:刘宏
学科分类:F0306
资助金额:18.00
项目类别:专项基金项目