驾驶舱话音记录器音源识别和说话人识别的基础研究

基本信息

批准号：U1233131

项目类别：联合基金项目

资助金额：43.00

负责人：杨琳

学科分类：

依托单位：中国民航科学技术研究院

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：陈利平,钟民主,刘建,宋黎明,谢孜楠,毛延峰

关键词：

说话人识别音源识别驾驶舱话音记录器

结项摘要

The background sound and voice information recorded in aircraft Cockpit Voice Recorders (CVRs) have long been considered as a crucial source of information in addition to flight data in aircraft accident investigations since in most cases they are the latent signal transducers and the only available source of human performance information. Learning from various experiences of the aircraft accident investigation communities of other ICAO members, such as NTSB of United States, MAK of Russia, ATSB of Australia and Taiwan of China, CAAC has been focusing its effort on in depth analysis of different kinds of CVR information. In the aspect of speech information, our research includes development of discourse analysis, speech analysis, and conversation analysis methods based on Chinese pilots'' speech characteristics to evaluate the pilot''s stress level, workload, fatigue, and possible alcohol or drug intoxication. In the aspect of non-speech information, we have applied wavelet transform (WT) and Chirp z-transform (CZT) algorithms to get more accurate spectrum characteristics. Different sound sources from the output of a given aircraft''s CVR can be successfully separated and identified using Adaptive Noise Cancellation (ANC), Blind Signal Separation (BSS), and Back Propagation Neural Network techniques. Knowledge and insights obtained from these researches will greatly improve CAAC''s aircraft accident investigation process.

现代航空器上安装的驾驶舱话音记录器（Cockpit Voice Recorder，CVR）是必不可少的机载设备，它通过四个独立声道记录着驾驶舱内最近2小时或30分钟的各种声音，包括机组内话、陆空管制通话、音响警告等，分析CVR上记录的话语声音和非话语声音信号是事故调查的重要手段。CVR记录的声音信号受多种因素影响而难以准确识别。目前国外对该信号的应用处于起步阶段，只是通过某一航空器事故案例进行分析，没有形成一套完整、系统的分析方法和技术。国内利用小波技术仅分析了部分开关声的声学特征，这影响着航空器事故原因的深入调查。本研究旨在利用哈希表、美尔倒谱系数及其差分技术，将CVR记录的话语声音信号和非话语声音信号进行音源识别和说话人（机组成员和空中交通管制员）识别，开展CVR记录识别方法的基础研究，提出针对多种不同类型信号的识别方法，从而更加有效、准确确定典型航空器事故发生的情境和发生原因。

项目摘要

项目背景：分析驾驶舱话音记录器（CVR）上记录的话语声音和非话语声音信号是事故调查的重要手段。CVR 记录的声音信号受多种因素影响，有时难以准确识别，这影响着航空器事故原因的深入调查。利用声学技术手段，如哈希表、美尔倒谱系数及其差分技术等，将CVR 记录的话语声音信号和非话语声音信号通过与样本比对进行音源识别和说话人（机组成员和空中交通管制员）识别，开展CVR 记录识别方法的基础研究，提出针对多种不同类型信号的识别方法，从而更加有效、准确确定典型航空器事故发生的情境和发生原因。.主要研究内容：音频和说话人多种特征提取方法研究；统计建模方法；语音分段及聚类方法研究；说话人识别方法研究；将音频和说话人识别方法应用在航空器事故调查案例的实验研究。.重要结果：建立了CVR记录中所需识别的非话语声音样本信息库，录制典型机型模拟机、地面测试飞机、航班运行飞机驾驶舱内关键按钮、拨动开关、操纵手柄声等音频作为样本，与实际CVR音频文件中待检测的音频进行比较、分类。将样本音频特征与驾驶舱话音记录器待检测的音频进行匹配，根据匹配程度给出检索结果，以精度和召回率作为系统性能的检测指标。说话人识别基于各个检测说话人的似然比分数，采用贝叶斯信息准则方法，把语音切割成不同说话人语音段，把这些语音段聚类到几个说话人，当似然比分数大于阈值时，表示是待检测的说话人。.关键数据：使用CVR非话语声音样本信息库作为音频检索系统的样本。采用基于哈希表的查询式搜索方法，将所有音频特征数据建立一个较大的哈希表，将音频文件的特征值序列和出现该特征值对应的待检测音频进行比较，计算之间的比特差异率。根据匹配程度给出检索结果，以精度和召回率作为系统性能指标。以NIST（美国国家标准技术研究院）06 SR评测为例，完成NIST说话人评测任务和实验数据，说话人识别时，系统能稳定达到说话人闭集识别候选选准率≧92%，说话人数<=50人；说话人确认时，系统稳定达到等错率≤10%。性能和国际最好水平相近或相当。.科学意义：CVR已成为航空器事故调查须依赖的工具之一，尤其对于那些目前不要求安装FDR的小型飞机而言，CVR记录更是最重要的信息来源之一。事故调查人员凭经验可以辨别出一些音频含义，而其他重要的CVR信息凭人耳无法辨别。利用当前先进的声音分析方法和技术手段，有效判断CVR记录信息中所蕴含的内容，对确定事故原因有重要意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16383/j.aas.2016.c150880

发表时间：2016

DOI：10.11821/dlyj201810008

发表时间：2018

DOI：10.3969/j.issn.1003-0077.2018.11.009

发表时间：2018

DOI：10.3724/sp.j.1089.2022.19009

发表时间：2022

DOI：10.19783/j.cnki.pspc.200521

发表时间：2021

杨琳的其他基金

批准号：41471178

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：30570733

批准年份：2005

资助金额：26.00

项目类别：面上项目

批准号：31500479

批准年份：2015

资助金额：19.00

项目类别：青年科学基金项目

批准号：30400217

批准年份：2004

资助金额：20.00

项目类别：青年科学基金项目

批准号：71702136

批准年份：2017

资助金额：18.00

项目类别：青年科学基金项目

批准号：71804166

批准年份：2018

资助金额：19.50

项目类别：青年科学基金项目

批准号：30200075

批准年份：2002

资助金额：20.00

项目类别：青年科学基金项目

批准号：11504406

批准年份：2015

资助金额：24.00

项目类别：青年科学基金项目

批准号：81501289

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：31660209

批准年份：2016

资助金额：39.00

项目类别：地区科学基金项目

批准号：31860209

批准年份：2018

资助金额：40.00

项目类别：地区科学基金项目

批准号：51402206

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：30971221

批准年份：2009

资助金额：31.00

项目类别：面上项目

批准号：30973224

批准年份：2009

资助金额：31.00

项目类别：面上项目

批准号：31870545

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：81704004

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：11604072

批准年份：2016

资助金额：22.00

项目类别：青年科学基金项目

批准号：81403211

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：31700443

批准年份：2017

资助金额：22.00

项目类别：青年科学基金项目

批准号：41001298

批准年份：2010

资助金额：18.00

项目类别：青年科学基金项目

批准号：81760416

批准年份：2017

资助金额：34.00

项目类别：地区科学基金项目

批准号：61901478

批准年份：2019

资助金额：25.50

项目类别：青年科学基金项目

批准号：21407033

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：60776819

批准年份：2007

资助金额：23.00

项目类别：联合基金项目

批准号：31260178

批准年份：2012

资助金额：50.00

项目类别：地区科学基金项目

相似国自然基金

噪声和短语音条件下的说话人识别

批准号：61370034

批准年份：2013

负责人：张卫强

学科分类：F0605

资助金额：82.00

项目类别：面上项目

基于听觉感知模型的说话人识别和语音语种识别新方法研究

批准号：60572083

批准年份：2005

负责人：刘加

学科分类：F0111

资助金额：23.00

项目类别：面上项目

人工神经网络说话人识别方法研究

批准号：69475007

批准年份：1994

负责人：迟惠生

学科分类：F0605

资助金额：5.50

项目类别：面上项目

基于迁移学习的跨信道说话人识别研究

批准号：61105026

批准年份：2011

负责人：洪青阳

学科分类：F0605

资助金额：24.00

项目类别：青年科学基金项目

驾驶舱话音记录器音源识别和说话人识别的基础研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于SSVEP 直接脑控机器人方向和速度研究

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

基于细粒度词表示的命名实体识别研究

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

杨琳的其他基金

数字土壤制图中人类活动影响因子的定量刻画

尖端扭转型室速发生机制与时空异质性特征的定量心脏电生理研究

基于显微形态学的桉树细胞皱缩及其回复机制与调控研究

羧基肽酶H致自身免疫糖尿病的机制研究

复杂项目应对交叉延误：组织驱动机理、分布规律预测与同步策略研究

不确定性环境下可再生能源和CCUS协同减排的机理、效应与政策机制研究

妊娠期MRI暴露降低子代学习记忆能力的分子机制研究

基于因子分析的会话语音说话人识别研究

SYTL3基因与新生儿胼胝体发育不良的关系及分子机制研究

中国重要竹子害虫额垠叶蝉族的区系分类、DNA条形码及系统发育研究

中国竹子叶蝉区系、分类及DNA条形码研究

炭/铜合金体系的界面形成和润湿机制

M细胞岛形分布特征与折返激动易损性关系的定量心脏电生理研究

抗癫痫药物对生后未成熟脑学习记忆影响的机制研究及雌二醇的保护作用

人工林桉木超临界CO2干燥热质传递规律及皱缩抑制机制

基于周细胞募集信号探讨补阳还五汤维持血脑屏障完整性防治Alzheimer病的机制

基于CuInS2固态量子点敏化太阳电池的构建及界面载流子动力学的研究

基于药物代谢组学方法研究益气活血中药有效部位配伍增强阿司匹林抗血小板作用的机理

Na+/H+ 逆向转运蛋白提高浮萍镉胁迫抗性的机制研究

基于样点代表性等级的采样设计方法及其在土壤空间分布推测中的应用

利用靶向神经移植术重建缺失肢体运动神经信息源及机制研究

用于脑卒中早期检测与快速鉴别的多频电阻抗谱识别成像算法研究

全氟化合物前体物质胎儿、婴儿暴露途径与体内代谢转化研究

基于盲源分离和神经网络的舱音记录器非话语信号分离与识别基础研究

西南地区竹子叶蝉类昆虫的物种多样性研究

相似国自然基金