面向智能人机交互的移动机器人双耳声源定位研究

基本信息

批准号：61673030

项目类别：面上项目

资助金额：65.00

负责人：刘宏

学科分类：

依托单位：北京大学深圳研究生院

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：杨戈,萧伟,丁润伟,沈苗,刘梦源,庞程,孙淼,马里千

关键词：

人机协作人机交互安全

结项摘要

Mobile robot auditory system is an important way for friendly interaction between a robot and external objects. For binaural sound source localization, the direction and distance of a sound source can be estimated by the perceptive differences of two ears of the robot to the sound source. However, the movement of a mobile robot will lead to continuous changing of the mounted dummy head 's position and posture, which brings about many new challenges to the existing approaches. As with a moving robot, it is difficult to extract effective binaural cues in complex environments. High computational complexity of present multiple sound sources localization algorithm can’t satisfy the real time requirement in continuous localization. Signals received by a microphone array will own inconsistent spatial constraints due to the movement and rotation of the dummy head. This project researches the dummy head topology which can be conveniently carried on various mobile robot platforms. For a real-time and robust multiple sources localization method, binaural microphones based clustering triangulation localization algorithm is used. Then, a dynamic cross-correlation warping technology is introduced, which can effectively estimate the time delay and intensity from the microphone signals with inconsistent spatial constraints. By using the spatial dependence of signal delay and joint analysis the time difference and intensity difference within narrow/broad frequency band, an information fusion technology is designed for multiple signals emitted by the identical or different sound sources. The effectiveness of the proposed sound source localization method mentioned above will be tested by many offline and online experiments in HRI environments including mobile robots and speakers.

移动机器人听觉系统是实现机器人与环境目标自然、友好交互的重要途径。双耳声源定位方法利用两只麦克风对同一声源信号的感知差异实现声源方位和距离的计算。人机交互面临复杂的噪声、混响等声学环境，机器人本体运动会造成机载双耳人工头空间位置和姿态的连续变化，对现有的定位方法和系统形成了新的挑战——复杂环境下双耳定位线索难以提取；多声源定位算法复杂度高难以满足机器人运动中连续定位的实时性要求；机器人本体运动会导致麦克风阵列接收声源信号空间约束的不一致。本项目研究具有一定抗噪、抗混响能力的双耳麦克风阵列实时鲁棒的声源定位方法；提出动态双耳线索规整方法，从不一致的信号空间约束中提取有效的时延和能量信息；基于信号时延空间和时间依赖关系，建立机器人运动过程中运动声源定位的信息融合策略。通过移动机器人对周围说话人的声源定位大量实验，验证上述方法的有效性。

项目摘要

移动机器人听觉系统是实现机器人与环境目标自然、友好交互的重要途径。双耳声源定位方法利用两只麦克风对同一声源信号的感知差异实现声源方位和距离的计算。人机交互面临复杂的噪声、混响等声学环境，机器人本体运动会造成机载双耳人工头空间位置和姿态的连续变化，对现有的定位方法和系统形成了新的挑战——复杂环境下条件下双耳定位线索难以提取，多声源定位算法难以满足机器人运动中对移动声源连续定位的实时性要求，交互场景下声源间歇性发声会导致活跃声源数量动态变化、声源位置跟踪失败。.本项目围绕智能人机交互场景下的移动机器人双耳声源定位展开研究。针对噪声混响条件下双耳定位线索受到严重影响问题，提出一种基于混响加权机制和广义参数匹配方法来抑制前后混响同时保留直达信号双耳线索，采用深度卷积神经网络提取噪声无关的双耳互相关线索进而用于时延估计；针对多声源定位实时性要求和声源个数未知带来的性能下降问题，提出时延补偿估计算法，打破了双耳时间差和能量差线索提取不同步的局限性，联合双耳线索聚类分析策略实时定位多声源，设计一种基于空间主特征向量的多声源个数和位置联合估计算法，实现活跃声源数量动态变化条件下的多声源定位；针对机器人运动场景下的移动声源连续定位，在粒子滤波器中加入观测值引导机制和视听多模态融合策略，利用当前帧位置信息和视觉人体身份信息来辅助完成间歇性发声声源的连续跟踪；针对实际人机交互场景的友好型需求，提出基于互注意力迭代机制的特征对齐网络多模态关键词识别算法启动人机对话，通过融合同一声源多次发声的信息完成最终的定位决策。.本项目搭建了支持双耳听觉的移动机器人实验平台，建立了机器人双耳声源定位实验仿真和真实场景数据库，通过进行多场景、复杂条件下的声源定位性能测试验证上述方法的有效性和先进性，达到了预期的技术和成果指标。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

DOI：10.13196/j.cims.2021.02.006

发表时间：2021

DOI：10.3969/j.issn.1007-5461.2022.01.004

发表时间：2022

DOI：10.11654/jaes.2019-1304

发表时间：2020

DOI：

发表时间：2020

刘宏的其他基金

批准号：41602166

批准年份：2016

资助金额：22.00

项目类别：青年科学基金项目

批准号：51305335

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：50572052

批准年份：2005

资助金额：27.00

项目类别：面上项目

批准号：30640053

批准年份：2006

资助金额：10.00

项目类别：专项基金项目

批准号：51372142

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：41571010

批准年份：2015

资助金额：75.00

项目类别：面上项目

批准号：U1613209

批准年份：2016

资助金额：260.00

项目类别：联合基金项目

批准号：61370179

批准年份：2013

资助金额：75.00

项目类别：面上项目

批准号：51732007

批准年份：2017

资助金额：300.00

项目类别：重点项目

批准号：60675025

批准年份：2006

资助金额：26.00

项目类别：面上项目

批准号：81403288

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：81273258

批准年份：2012

资助金额：75.00

项目类别：面上项目

批准号：60875050

批准年份：2008

资助金额：32.00

项目类别：面上项目

批准号：51504242

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：81760085

批准年份：2017

资助金额：32.00

项目类别：地区科学基金项目

批准号：21405014

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：69301002

批准年份：1993

资助金额：6.30

项目类别：青年科学基金项目

批准号：30772048

批准年份：2007

资助金额：28.00

项目类别：面上项目

批准号：30200316

批准年份：2002

资助金额：19.00

项目类别：青年科学基金项目

批准号：60275032

批准年份：2002

资助金额：20.00

项目类别：面上项目

批准号：71673313

批准年份：2016

资助金额：46.00

项目类别：面上项目

批准号：50435040

批准年份：2004

资助金额：150.00

项目类别：重点项目

批准号：51708381

批准年份：2017

资助金额：27.00

项目类别：青年科学基金项目

批准号：41371040

批准年份：2013

资助金额：90.00

项目类别：面上项目

批准号：71203244

批准年份：2012

资助金额：18.00

项目类别：青年科学基金项目

批准号：61340046

批准年份：2013

资助金额：18.00

项目类别：专项基金项目

批准号：60802067

批准年份：2008

资助金额：18.00

项目类别：青年科学基金项目

批准号：50872070

批准年份：2008

资助金额：35.00

项目类别：面上项目

相似国自然基金

听力损失系统双耳声源定位模型研究

批准号：11504404

批准年份：2015

负责人：桑晋秋

学科分类：A2305

资助金额：22.00

项目类别：青年科学基金项目

混响环境下双耳声源定位的研究及应用

批准号：11674352

批准年份：2016

负责人：夏日升

学科分类：A2305

资助金额：64.00

项目类别：面上项目

用于声源定位的双耳优先效应计算模型

批准号：11774380

批准年份：2017

负责人：胡琦

学科分类：A2305

资助金额：64.00

项目类别：面上项目

基于主动探测的移动机器人声源目标定位方法

批准号：61305101

批准年份：2013

负责人：祖丽楠

学科分类：F0306

资助金额：23.00

项目类别：青年科学基金项目

面向智能人机交互的移动机器人双耳声源定位研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

面向人机交互的数字孪生系统工业安全控制体系与关键技术

综述:基于轨道角动量光子态的高维量子密钥分发

腐植酸调节砷酸盐生菜毒性作用研究

基于水安全目标的城市绿地水体设计方法研究——以第二届河北省园林博览会(秦皇岛)园区为例

刘宏的其他基金

二叠-三叠纪之交特提斯浅海古海洋氧化—还原状态的时空波动：来自微生物岩的沉积记录

钛及钛合金激光焊接头BCC→HCP相变机制及对组织性能影响

化学法制备硫族化合物纳米薄膜和量子阱的研究

在小RNA水平上靶向性调控胰岛素分泌的研究

近红外光催化机理与纳米带表面异质结构全光谱太阳光催化材料

河流裂点迁移对洞穴发育过程影响研究：以中国云南宝牛角洞为例

面向服务机器人的视听感知融合与多模态人机交互关键技术

基于相似图谱的脑MR图像海马体自动分割方法研究

基于光波导效应的内通光光催化及其工业水处理应用中的基础问题

面向人体目标实时跟踪的视觉注意转移机制研究

基于脑缺血动物模型的“肾通于脑”中医理论的生物学实质研究

Foxo1参与活化nTregs CD127表达上调的机制研究

人机互动环境下机器人实时运动规划研究

柔性孔径可变MOFs材料对通风瓦斯的吸附特性及其甲烷提浓研究

CD147介导的巨噬细胞自噬在血管紧张素II致动脉粥样硬化中的作用及机制研究

高效纸微流控分析芯片及其在POCT中的应用

传输均匀场的介质壁波导的研究及其应用

IL-15逆转CD4+CD25+Tregs低反应性的分子机制研究

牙周炎发生中脂氧合酶作用的研究

仿人机器人手局部自主操作的研究

我国农村基本养老保险制度对老年健康福利的政策绩效和作用机制研究

新一代仿人型残疾人假手系统及理论的研究

膜曝气生物膜反应器同步脱氮除硫的生物膜微观环境内生物过程机制研究

喀斯特包气带渗透过程及其水文地质含义研究

我国城镇居民基本医疗保险的经济学分析和绩效评估：基于微观数据的研究

基于麦克风阵列的移动机器人实时声源定位方法研究

复杂场景中数目变化的视觉多目标实时跟踪技术研究

表面异质结构对二氧化钛纳米带光电与气敏性能的调控机理及应用探索

相似国自然基金