研究如何利用案犯留下的电话语音信息,辨认罪犯的性别、年龄、籍贯等,最终达到破案的目的。为此,我们将选择语音辨识中的若干关键技术问题,作为本课题研究的重点内容。具体为:(1)构建一个发音人数量有限,语音样本数据有限,而能反映中国地域方言特征的电话语音数据库;(2)提出一种新的动态半监督学习算法,自动获取方音各地方言特性的语音发音基元,并利用该基元对语音信号进行自动切分;(3)针对识别基元提出一种韵律特征与倒谱特征相融合的语音新特征;(4)提出一种分类器融合新方法,该方法,一方面将基元帧特征矢量通过曲线拟合方法实现动态时间规整,获得包含地域和时域信息的等维特征矢量,并送支撑矢量机进行学习和识别;另一方面,提出一种新的渐变隐马尔可夫模型,该模型可根据语音信号的非稳态特点,及时调整模型参数,从而达到更好地辨识的目的。两者按照分类器融合方法,可得到发音人的性别、年龄和地域信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
基于SSVEP 直接脑控机器人方向和速度研究
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
新一代汽车中智能语音处理若干关键技术研究
电话信道的自然语音语言辨识技术研究
汉语耳语音感知中关键技术研究
藏语语音合成关键技术研究