多少数民族语言连续语音识别方法及应用

基本信息

批准号：61633013

项目类别：重点项目

资助金额：245.00

负责人：郑方

学科分类：

依托单位：清华大学

批准年份：2016

结题年份：2021

起止时间：2017-01-01 - 2021-12-31

项目状态：已结题

项目参与者：王东,艾斯卡尔·艾木都拉,于洪志,李冠宇,山拜·达拉拜,格根塔娜,加羊吉

关键词：

深度神经网络声学模型解码算法多语种语音识别模型训练

结项摘要

China involves multiple nations, and each nation has its unique language. The research on cross-lingual and multi-lingual phenomenon is highly important for national amalgamation, cultural harmonics and social stability. This research focuses on automatic speech recognition (ASR) for minority languages, particularly the techniques for multi- and minor- lingual ASR. The goal is to establish a unified framework for model training and decoding, which can not only support minority languages with relatively rich resources (e.g., Uyghur and Mongolia), but can also be migrated to other low-resource languages. At the same time, this project will establish and open a series of data, tools and standards. We hope it can motivate the research on ASR and related fields including information retrieval and natural language understanding.

中国是一个多民族国家，每个民族都有自己独特的语言。研究多民族背景下的多语言和跨语言现象，对促进语言互通互融、建设文化和谐、维护民族稳定具有重要意义。本研究关注少数民族语音识别技术，特别是多少数民族语言的语音识别技术，实现一个可适用于多少数民族语言的统一建模方法和识别系统，该方法和系统既可以支持资源相对丰富的少数民族语言（如维吾尔语，蒙古语），也可快速移植到其它资源稀缺的少数民族语言。同时，本项目还将建设公开一系列数据资源、测试标准、标注平台和处理工具，推动多少数民族语言语音识别和相关领域(如信息抽取、自然语言理解等）的研究进程。

项目摘要

中国是一个多民族国家，每个民族都有自己独特的语言。研究多民族背景下的多语言和跨语言现象，对促进语言互通互融、建设文化和谐、维护民族稳定具有重要意义。本项目研究关注多少数民族语言的语音语言信息处理技术，涉及研究任务覆盖了多少数民族语言的语音识别、语种识别、说话人识别、语音合成、机器翻译等；代表性研究工作包括面向数据稀缺问题的语音信息深度分解与重构、面向零/低资源条件的无/半监督迁移学习、面向领域知识长尾问题的符号化神经模型建模与推理等。基于这些研究工作，实现了可适用于多少数民族语言的语音语言信息处理的方法和系统。本项目面向少数民族语言的语音和语言资源建设，公开一系列数据资源、测试标准、标注平台和处理工具，推动了多少数民族语言的语音语言信息处理和相关领域（如信息抽取、自然语言理解等）的研究发展。本项目不仅从科学研究的角度探索了多少数民族语音语言信息处理中的关键问题，还实现了科学研究的成果转化。基于本项目研究成果的动态密码语音认证技术，现已支持汉语、维语、蒙语、藏语等多个语种，在公共服务、金融支付等领域有着广泛应用，为国家信息安全、社会民生提供了重要保障。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

郑方的其他基金

批准号：61271389

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：38770741

批准年份：1987

资助金额：2.00

项目类别：面上项目

批准号：71702124

批准年份：2017

资助金额：18.00

项目类别：青年科学基金项目

批准号：39470673

批准年份：1994

资助金额：5.00

项目类别：面上项目

相似国自然基金

基于认知半监督持续学习的连续语音识别方法研究

批准号：60772076

批准年份：2007

负责人：李海峰

学科分类：F0113

资助金额：28.00

项目类别：面上项目

基于电话语音的少数民族语言识别研究

批准号：60865002

批准年份：2008

负责人：杨鉴

学科分类：F0605

资助金额：25.00

项目类别：地区科学基金项目

濒危少数民族语言语音声学数据库及声学分析

批准号：60672111

批准年份：2006

负责人：黄行

学科分类：F0111

资助金额：24.00

项目类别：面上项目

基于语音增强的鲁棒性语音识别方法研究

批准号：62001446

批准年份：2020

负责人：屠彦辉

学科分类：F0117

资助金额：16.00

项目类别：青年科学基金项目

多少数民族语言连续语音识别方法及应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

郑方的其他基金

说话人识别中时变鲁棒的声纹特征研究

吸入麻醉自动控制基础的研究

新创企业社会资本跨层次转化及其双向作用机制的追踪研究

吸入麻醉深度与脑电频谱技术的相关基础研究

相似国自然基金