汉语与英语标准频谱语言清晰度客观评价方法差异性研究

基本信息
批准号:51278078
项目类别:面上项目
资助金额:80.00
负责人:祝培生
学科分类:
依托单位:大连理工大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:莫方朔,路晓东,郭飞,王时原,冯伟,祝岩,梁恒
关键词:
差异性语言清晰度客观评价方法汉语与英语标准频谱
结项摘要

Speech intelligibility is an important index of the sound quality evaluation. As an objective rating method of speech intelligibility based on the modulation transfer function,speech transmission index (STI) has gained international acceptance and was recommended by International Electrotechnical Commission (IEC). However, The STI method is primarily developed according to the standard English spectrum, so directly use of the STI method recommended by IEC 60268-16(4rd ed.2011.06)standard to rating Chinese speech intelligibility may be not appropriate. This is because that Chinese and English standard spectrums are different, and peoples who speak this two languages have cultural differences, and also the ability of understanding. This study intend to identify the differences between Chinese and English speech intelligibility when using the STI rating method, establish the corresponding relationship between subjective and objective rating of Chinese speech intelligibility, study and determine Chinese Absolute speech reception threshold; Auditory masking factor; Octave band weighting and redundancy factors. On the basis of the above studies, a objective rating system for Chinese speech intelligibility will be established by revising the STI rating process recommended by IEC 60268-16 standard, Which also can provide technical reserves and the basis for the formulation of relevant domestic norms.

语音清晰度(或可懂度)是音质评价的重要指标。基于调制转移函数的语言清晰度客观评价方法-语言传输指数(Speech transmission index,STI)为国际社会普遍接受并被IEC推荐。但此方法主要是针对英语标准频谱制定的。由于汉语与英语标准频谱不同,使用汉语和英语这两种不同语言的主体在感受和理解上也存在文化差异,因此直接用IEC 60268-16(4.0版,2011.6发布)推荐的语言清晰度客观评价方法来评价汉语的语言清晰度并不合适。本研究拟找出汉语与英语标准频谱语言清晰度客观评价方法的差异性,建立汉语语言清晰度主、客观评价的对应关系,研究并确定汉语标准频谱的绝对语言识别阈值、听音屏蔽因子、权重因子、冗余因子,并依据这些研究对IEC 60268-16推荐的STI客观评价过程进行修正,在其基础上建立适合汉语的STI客观评价体系。研究成果同时可为国内相关规范的制定提供技术储备及依据。

项目摘要

言语可懂度是音质评价的重要指标。基于调制传递函数的言语可懂度客观评价方法—语音传输指数STI为国际社会普遍接受并被IEC推荐。但此方法主要是针对西方语言体系制定的。由于汉语与英语标准频谱不同,使用汉语和英语这两种不同语言体系的主体在感受和理解上也存在文化差异,因此直接用IEC 60268-16(2011)推荐的言语可懂度客观评价方法来评价汉语的言语可懂度是否适用也一直是人们关注的问题。本课题计算出了汉语的标准语言频谱,建立了汉语言语可懂度主、客观评价的关系曲线,研究了汉语语言体系下的标准语言频谱、绝对言语识别阈值、听觉掩蔽因子、权重因子、冗余因子对STI结果的影响。结果表明,受使用条件的影响,汉语的绝对言语识别阈值、听觉掩蔽因子带来的影响较小,汉语的标准语言频谱、权重因子带来的影响较大;与使用IEC推荐的标准频谱相比,汉语标准语言频谱可带来最大约0.054的STI偏差;使用汉语语言体系的权重因子、冗余因子标准偏差达到了5.70%,略大于使用IEC推荐的权重因子、冗余因子的4.73%,但小于使用英语标准语言频谱的6.9%。这些结果表明使用西方语言体系的绝对言语接收阈值、听音屏蔽因子、权重系数、冗余因子评价汉语的言语可懂度也具有适用性,虽然具有一定的误差,但在可接受范围内。..进一步的研究发现,由于STI方法定义复杂,存在诸多影响因素,可能对测量结果产生较大影响。作为本课题的拓展,对声源特性对STI测量结果的影响进行了研究;验证了音质仿真技术用于言语可懂度主、客观评价的准确性并对影响因素进行了量化;对比了直接法、间接法对对STI测量结果的影响;对采用Schroeder反向积分法计算窄带声能衰变函数进行了修正。其中声源特性对STI的影响研究表明,相较于仿真嘴,十二面体声源的指向性带来的最大STI偏差达到了0.123,4英寸监听音箱指向性带来的最大STI偏差达到了-0.065,频率响应不均衡带来的最大STI偏差达到了0.172。这些偏差也远大于汉语语言体系对STI的影响。..基于本课题的研究,取得了一系列成果,代表性的有:SCI论文4篇;主持制定了该领域的国家基础标准,将于近期发布。课题研究内容较多,课题组超额完成了研究任务,研究取得的成果对于STI方法的发展将产生积极影响,对STI在国内的推广也具有重要意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
4

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
5

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021

祝培生的其他基金

批准号:51778100
批准年份:2017
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

汉语语音清晰度客观评测方法研究

批准号:11204278
批准年份:2012
负责人:章斯宇
学科分类:A2304
资助金额:30.00
项目类别:青年科学基金项目
2

厅堂汉语清晰度及其与语言传输指数关系的研究

批准号:10774048
批准年份:2007
负责人:彭健新
学科分类:A2304
资助金额:30.00
项目类别:面上项目
3

汉语儿童英语单词解码学习困难相关语言认知技能的特点

批准号:30970908
批准年份:2009
负责人:陶沙
学科分类:C0908
资助金额:29.00
项目类别:面上项目
4

语音传输指数用于语言声厅堂音质客观评价研究

批准号:51778100
批准年份:2017
负责人:祝培生
学科分类:E0803
资助金额:60.00
项目类别:面上项目