在实际应用中,智能机器人的听觉系统检测到的声音信号往往是多个声源信号及其滤波和延迟信号的混合,为了提高机器听觉系统的语音识别能力,必须采用卷积盲源分离的方法先将源信号从它们的混合信号中分离出来。为满足机器人听觉系统的实际应用需求,使盲源分离算法向实用化发展,本课题在充分研究现有的卷积盲源分离算法的基础上,研究利用视听觉信息融合的方法来解决现有的卷积盲源分离算法在实际应用中存在的问题,如分离信号中的排序和幅度的不确定,欠定卷积混合信号盲分离和移动源混合信号盲分离等问题,使机器听觉系统能自动完成语音混合信号的盲分离,为盲源分离的实用化提供具有理论价值和实际价值的研究成果。
本项目在信号分离领域引入了视觉信息,实现了基于视听觉信息融合的双模式盲源分离。研究了基于学习的图像语音信号的稀疏表示及其特征提取的基本方法,并给出了构建视听觉信息融合模型的有效实现方法。利用视觉信息,如声源的位置信息、嘴唇的形态作为辅助信息,研究了消除目前卷积混合盲源分离算法中的排序和幅度不确定问题的方法,为信号盲分离提供了一种双模式的分离方法。课题组已发表学术论文22篇,其中SCI期刊论文9篇,EI论文9篇,授权中国发明专利3项,申请中国发明专利3项,获批5项相关国家级和省级科研项目。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于国产化替代环境下高校计算机教学的研究
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于改进LinkNet的寒旱区遥感图像河流识别方法
基于旋量理论的数控机床几何误差分离与补偿方法研究
新型树启发式搜索算法的机器人路径规划
非稀疏信号的欠定盲源分离研究
生理信号的欠定联合盲源分离研究
稀疏元分析理论及其在欠定盲卷积混叠信号处理中的关键问题研究
欠定盲分离中源信号数目估计问题的研究