基于小型麦克风阵列的声源定位方法研究

基本信息
批准号:60971098
项目类别:面上项目
资助金额:33.00
负责人:吴镇扬
学科分类:
依托单位:东南大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:周琳,蔡卫平,吴海洋,吕勇,郭检柟,张峰
关键词:
小型麦克风阵列空间听觉声源定位阵列信号处理
结项摘要

语音声源定位技术近年来已成为国内外研究的热点。本项目将阵列信号处理和人耳空间听觉原理相结合来研究基于小型麦克风阵列的声源定位方法。在已有的相位变换加权的可控响应功率算法基础上,充分利用声场环境的先验知识提高其鲁棒性,并根据算法的特点设计麦克风阵列以减少计算量,提高算法的实时性。进一步将MUSIC算法与相位变换加权相结合,实现混响环境下的多声源定位。本项目还将研究基于空间听觉原理的声源定位方法,将根据人的双耳听觉感知模型,从双耳声信号中提取声源的空间方位特征线索,并建立这些线索与目标声源方位的映射关系,从而实现声源定位。同时,我们将研究基于机器人特定头型的与头相关传递函数的声源定位方法。本项目的研究成果可广泛用于视频会议、免提通信、语音识别、说话人识别、机器人听觉等领域。

项目摘要

本项目主要研究基于麦克风阵列信号处理和基于人的空间听觉定位机理的声源定位的关键技术。为降低相位变换加权的可控响应功率(SRP-PHAT:Steered Response Power-Phase Transform)定位算法的计算量,满足实时要求,我们提出了三种实时有效的改进算法:设计了一种正交线阵,采用该线阵实现SRP-PHAT算法,可以大幅度减少计算量;利用空间中相邻区域的时延差矢量很近似这一特点,采用了基于聚类搜索的加速SRP-PHAT定位算法;受小型麦克风阵列的空间功率谱启发,提出了基于三线快速搜索的SRP-PHAT算法。为提高SRP-PHAT定位算法在低信噪比环境中的定位精度,我们引入了两种改进算法:基于主特征向量的改进SRP声源定位算法,和基于AC(Agglomerative Clustering)聚类的小型均匀圆阵声源算法。为增强相位变换加权的广义互相关法对噪声和混响的鲁棒性,我们提出两种改进的时延估计算法:基于自适应频率选择的鲁棒时延估计算法,和结合激励信息和PHAT加权的时延估计方法。为了在恶劣环境中也能实现声源定位,提出了基于鉴别互相关函数的声源定位算法。在有多个说话人的情况下,定位算法的性能受到声源之间的相互干扰而急剧下降。我们利用语音信号在时-频域的稀疏特性,引入了两种多声源定位算法:基于子带SRP的多声源定位算法,和基于相位差复指数的两个麦克风多声源定位算法。我们模拟人耳听觉系统的声信号处理机制,给出了三种算法有效优化了现有的声源定位系统:为克服双耳定位线索对于声源频率的限制,采用了多子带联合定位算法;为解决“前后混淆”现象,提出了基于耳间强度差和耳间时间差联合判决的双耳声源定位的模型;为提高双耳声源定位算法对噪声的鲁棒性,引入了一种基于子带信噪比估计的双耳声信号声源定位方法。利用离线测量得到的特定头型与头相关脉冲响应,给出了基于双耳互相关函数的定位算法。我们提出了一种改进的结合静音检测的声源跟踪算法,有效地减少了静音期间的跟踪误差。我们结合常规可控波束形成(SBF:Steered Beamformer)和SRP-PHAT两种定位函数的优点,给出了一种改进算法,可以明显改善在低信噪比、强混响环境中的跟踪性能。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

DOI:10.7498/aps.67.20171903
发表时间:2018
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
4

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
5

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020

吴镇扬的其他基金

批准号:69871009
批准年份:1998
资助金额:13.00
项目类别:面上项目
批准号:69581001
批准年份:1995
资助金额:9.00
项目类别:专项基金项目
批准号:60672094
批准年份:2006
资助金额:26.00
项目类别:面上项目
批准号:60272044
批准年份:2002
资助金额:20.00
项目类别:面上项目

相似国自然基金

1

分布式麦克风阵列声源定位算法研究

批准号:60940007
批准年份:2009
负责人:张一闻
学科分类:F0111
资助金额:10.00
项目类别:专项基金项目
2

基于麦克风阵列的移动机器人实时声源定位方法研究

批准号:61340046
批准年份:2013
负责人:刘宏
学科分类:F0306
资助金额:18.00
项目类别:专项基金项目
3

基于声音-视觉声源定位的麦克风阵列语音增强技术研究

批准号:60502041
批准年份:2005
负责人:张军
学科分类:F0111
资助金额:21.00
项目类别:青年科学基金项目
4

基于麦克风阵列的语音增强和定位方法研究

批准号:60372082
批准年份:2003
负责人:殷福亮
学科分类:F0111
资助金额:22.00
项目类别:面上项目