识别语音与模型训练语音中信道畸变的不匹配,即说话人识别的跨信道(Intersession)问题,这种不匹配会对说话人识别的性能产生很大的负面影响。本项目首次引入迁移学习(Transfer Learning)的方法,并融合说话人模型合成(SMS)算法,来解决跨信道识别率急剧下降的问题。.首先采用SMS算法得到不同信道下的说话人模型,并通过大量的实验数据来验证其依赖的假设;然后在信道数据不足情况下引入迁移学习方法,将其与SMS算法融合,来构建一个可靠的特定信道通用背景模型,并验证迁移学习方法的实效性。.针对跨信道问题,本项目进一步提出基于支持向量机的迁移学习框架,力求取得理论和关键技术的创新和突破,所取得的成果对高性能说话人识别研究具有重要的学术意义。
课题组紧紧围绕说话人识别方向,研究如何解决跨信道导致说话人识别性能急剧下降这一问题,着重从模型域进行改进,分别深入研究并实现支持向量机(SVM),潜在因子分析(LFA),迁移学习(Transfer Learning)等算法。其中SVM、LFA均已顺利实现,并取得较理想的实验结果。迁移学习原先采用了无监督迁移分量分析(UTCA),结合SVM,结果并不理想,可能的原因是目标域数据的覆盖面太窄,没法很广的覆盖到所有测试样例的环境。.结合国外最新研究进展,课题组找到更有效的迁移学习方法,即基于i-vector的类内协方差归一化(WCCN)和概率线性判别分析(PLDA)算法,其中WCCN把i-vector迁移到没有信道因素的新的矢量空间,然后再做Cosine距离比对,而PLDA经过信道补偿后,在得分域直接进行判决。针对新领域,PLDA的说话人空间矩阵和残差矩阵,可进一步做迁移学习,从源域的PLDA映射到目标域的PLDA。这部分工作仍在进行中。.本项目期间,课题组共发表论文10篇,其中EI检索3篇,获得发明专利授权2项,制定公安部声纹标准1项,毕业硕士研究生5名。项目研究成果应用到公安司法、市场调查等行业,取得良好的社会经济效益。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于子空间迁移学习的跨语种语音情感识别研究
基于人工神经网络的说话人识别研究
基于JFA的耳语发音方式下说话人识别研究
基于因子分析的会话语音说话人识别研究