支持向量机,具有简洁的数学形式和良好的泛化能力, 能较好地解决小样本、非线性、高维数和局部极小点等实际问题。而对于语音识别, 直接用频率参数去建立SVM语音模型,特别在普通语音条件下,存在着特征参数的维数很高,运算量和内存需求非常大等问题。从如何处理大规模样本集的训练问题、提高训练算法收敛速度等方面的角度出发,提出了一种改进的SVM算法,构建最优的识别分类器可以有效地解决传统分类器的过学习、泛化能力差和维数灾难等问题;并在此基础上,通过对VQ、DTW、HMM、GMM等方法的比较,找出一种可以与SVM融合较好的方法,以降低训练语音的长度对SVM话者模型的制约,使系统的性能得到改进,进而可以弥补了传统SVM的缺点,并且在整个识别过程中具有一种自适应调节的能力,具有较大的研究意义和美好的应用前景。
随着计算机技术的飞速发展,语音识别已经在机器学习和模式识别技术中得到了广泛的应用。本项目在分析了语音识别的研究发展现状基础上,通过对VQ、DTW、HMM、GMM等方法的比较,鉴于支持向量机具有简洁的数学形式和良好的泛化能力, 能较好地解决小样本、非线性、高维数和局部极小点等实际问题,提出了一种与SVM融合较好的改进算法。构建了以这该算法为核心的语音识别系统,并将该系统在软硬件上均进行了仿真验证。. 该语音识别系统由预处理、特征提取、建立模型、模式匹配、判决等部分组成。在识别系统前端部分,采用了半软阈值降噪算法,利用小波的多分辨率分析特性滤除说话人语音的噪声污染,得到尽可能纯净的原始语音,由于传统的基于短时平均幅度和短时平均过零率的端点检测在低噪声比环境下准确率较差,因此本项目采用了基于谱熵的端点检测方法,在模型建立与模式匹配部分,重点研究了统计学习理论——支持向量机 SVM,并将 VQ 码本设计与 SVM 模型相结合构建了改进的 VQ-SVM二次识别的新融合语音识别系统。. 最后对该语音识别系统在 Matlab 及 DSP 平台上进行性能分析,实验结果显示该系统识别率较高,具有较好的实用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于多模态信息特征融合的犯罪预测算法研究
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
面向语音识别的抗噪支持向量机优化算法
支持向量机(SVM)方法在基因信号识别中的应用研究
基于支持向量机的营销风险识别与预警研究
基于支持向量机的声发射信号裂纹识别研究