本项目研究用汉语鼻声母m平稳段(20ms)的极零模型零点系数幅度谱为参数的,四种训练和识别方法的20人讲话者识别系统。这些方法是平均模板法,平均模板改进法,矢量量化法和神经网络法,由于鼻腔形状大小各人都不相同,讲话时又不运动,所以反映鼻腔反共振的零点系数是一种很好的个性特征参数。即使采用最简单的平均模板及其改进法,由实验也得到证实。其中平均模板法的改进是使用了个性集聚好的那些频率点来得到模板的。若用矢量量化和神经网络法,则可得到惊人识别效果;训练集内和训练集外的单音识别首选正识率就可达80%和60%。而每次随机选取5个单音平均表识别,则可高达100%和92%,已有实用价值。本项目所有成果 ,国内外均未见报导。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于改进LinkNet的寒旱区遥感图像河流识别方法
新型树启发式搜索算法的机器人路径规划
二维FM系统的同时故障检测与控制
脉冲直流溅射Zr薄膜的微结构和应力研究
声母和韵母切分的汉语语音识别研究
腭裂语音高鼻音等级自动识别关键技术研究
汉语声调的快速实时模糊识别方法
用定量化变调规则和移调方法合成汉语语调