基于结构建模的语音理解及应用研究

基本信息

批准号：61300197

项目类别：青年科学基金项目

资助金额：20.00

负责人：张剑

学科分类：

依托单位：东莞理工学院

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：陈倩,赵维佺,侯家利,陈扬扬,何文斌,林楠

关键词：

语音理解语音摘要语音文档结构建模

结项摘要

Speech Understanding (SU) is a young and under-exploited research field based on Automatic Speech Recognition (ASR) and Natural Language Understanding (NLU). In the proposal, our research work focuses on how to apply structural modeling technology for speech understanding and summarization, which can help users understand speech documents faster and more exactly by hidden structure information extracted from speech documents. More and more researchers take their interests in this topic. Considering that speech recognition result is not reliable, traditional structural modeling algorithms only using transcribed text do not perform well due to recognition errors by speech recognition system. To handle this challenge, we investigate sorts of features extracted from speech signal and transcribed documents and select the best ones to extract the hidden structure information from speech documents. We then propose novel algorithms based on traditional machine learning algorithms for structure extraction process and further using structure information to improve the performance of speech understanding and summariztion task. We will evaluate the proposed algorithms on the lecture conference speech corpus. On one hand, using our proposed algorithms can extract structure information hidden in speech documents more effectively and then help us more conveniently understand and summarization speech documents. On the other hand, our proposed speech understanding system using structural modeling can offer better theoretical support and a practical approach for huge multimedia documents management and security.

近年来发展的语音理解是建立在语音识别和自然语言理解之上的新兴研究领域。本项目主要研究基于结构建模的语音理解与摘要技术，以能够帮助人们从语音文档中抽取出隐含的结构信息，更快速准确地理解语音文档，已成为本领域研究热点和前沿。由于语音识别技术的不完善，所生成文本含有不准确之处，对传统的基于文本结构建模是极大的挑战。针对此问题，本项目将在特征提取、模型算法及应用方面，在现有工作基础上进行深入研究：分析深层次语音文档结构，寻找对抽取语音文档结构帮助更大的新特征；应用不同的机器学习算法，提高抽取语音文档结构的性能，并运用抽取的结构信息，改善语音理解与摘要抽取的性能；将新算法应用于演讲语音领域。通过本项目的研究，一方面能够建立更有效的针对深层次语音文档结构建模的新算法，提高抽取语音摘要的性能与效率；另一方面基于结构建模的语音理解为海量语音文档管理与安全提供更好的理论支持与实用途径。

项目摘要

本项目主要研究了基于结构建模的语音理解与摘要技术，用于帮助人们从语音文档中抽取出隐含的结构信息，更快速准确地理解语音，该研究问题已成为本领域的研究热点和前沿。.本项目从特征提取、模型算法及应用等方面进行了深入的研究。主要研究成果如下：（1）对有关语音理解及摘要提取的最新研究文献进行了广泛的调研与深入考察；（2）研究了在不同文体的语音数据库上的语音理解与摘要算法的性能，并比较了各类特征的作用。在不同形式的两类语音文档:中文广播语音文档和粤语会议语音文档，进行了评测实验。结果显示:在进行中文广播语音文档摘要提取实验中，结构信息特征要优于文法信息特征。这是由于广播新闻语音文档潜在的结构信息相对稳定；（3）比较了不同机器学习算法基于不同特征所构建摘要模型的性能表现。所得到性能最优的摘要模型其性能于中文广播新闻文档实验中，达到0.682 ROUGE-L F-measure，而于粤语会议文档实验中，达到了0.737 ROUGE-L F-measure，均属国际水平。此外，在粤语会议文档摘要抽取实验中，基于自动语音识别率仅为73%的语音抄本，所构建的摘要模型仍然能达到0.729 ROUGE-L F-measure的高水平；（4）对文本信息特征中所使用的词条权重算法进行了全面性能比较，并将生成的不同的文本信息特征用于自动语音摘要实验中进行评测。比较了多种不同的无监督和有监督学习的词条权重算法，并将不同算法所生成文本特征，通过最大票数策略进行了综合应用，以构建最有效的摘要模型。实验结果表明该策略有效。同时发现Term Relevance Ratio方法所生成的文本信息特征，能构建出最优的摘要模型。 .通过本项目的研究，一方面建立了更有效的针对深层次语音文档结构建模的新算法，提高了抽取语音摘要的性能与效率；另一方面对于将该算法应用于海量语音文档的理解以及组织管理方面，提供了更好的理论支持与实用途径，并做了实验验证。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.13191/j.chj.2017.0028

发表时间：2016

DOI：

发表时间：2017

DOI：

发表时间：

张剑的其他基金

批准号：71771022

批准年份：2017

资助金额：46.00

项目类别：面上项目

批准号：31001004

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：61303143

批准年份：2013

资助金额：26.00

项目类别：青年科学基金项目

批准号：81101499

批准年份：2011

资助金额：24.00

项目类别：青年科学基金项目

批准号：81070382

批准年份：2010

资助金额：30.00

项目类别：面上项目

批准号：11874028

批准年份：2018

资助金额：64.00

项目类别：面上项目

批准号：81803368

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：20602040

批准年份：2006

资助金额：26.00

项目类别：青年科学基金项目

批准号：81860183

批准年份：2018

资助金额：35.00

项目类别：地区科学基金项目

批准号：81360156

批准年份：2013

资助金额：48.00

项目类别：地区科学基金项目

批准号：30970896

批准年份：2009

资助金额：29.00

项目类别：面上项目

批准号：31771043

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：71071017

批准年份：2010

资助金额：27.00

项目类别：面上项目

批准号：30800360

批准年份：2008

资助金额：22.00

项目类别：青年科学基金项目

批准号：71603305

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：41461012

批准年份：2014

资助金额：50.00

项目类别：地区科学基金项目

批准号：61105089

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：31100171

批准年份：2011

资助金额：21.00

项目类别：青年科学基金项目

批准号：30801128

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：70771009

批准年份：2007

资助金额：19.00

项目类别：面上项目

批准号：81371707

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：11204153

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：81801640

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：31371056

批准年份：2013

资助金额：75.00

项目类别：面上项目

相似国自然基金

汉语语音理解系统

批准号：68673013

批准年份：1986

负责人：黄泰翼

学科分类：F02

资助金额：2.00

项目类别：面上项目

基于知识的汉语连续语音识别和理解

批准号：69072924

批准年份：1990

负责人：戴蓓倩

学科分类：F0211

资助金额：4.00

项目类别：面上项目

基于DBN协同建模的中文及跨语种语音结构事件检测研究

批准号：61175018

批准年份：2011

负责人：谢磊

学科分类：F0605

资助金额：59.00

项目类别：面上项目

融合耳蜗—神经元响应机制的听觉建模及语音识别应用研究

批准号：61906095

批准年份：2019

负责人：冯天荃

学科分类：F0605

资助金额：24.00

项目类别：青年科学基金项目

基于结构建模的语音理解及应用研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

基于SSR 的西南地区野生菰资源遗传多样性及遗传结构分析

石萆汤对弱精子症患者精子线粒体膜蛋白PHB及超微结构的影响

张剑的其他基金

工作激情影响员工创造性绩效的因果环机制研究：引入动态计算理论的分析

鸡CCT基因克隆及其与蛋黄卵磷脂生物合成关系的研究

融合时空约束与先验知识的表演驱动的人脸动画生成

hVPS52（高尔基体相关逆向转运复合体亚基）作为潜在抑癌基因的验证及机制探究

转移CTLA4Ig和CD40LIg双基因修饰骨髓间充质干细胞诱导大鼠肝移植免疫耐受

新型氢键型二维层状材料MOHXenes的制备及高压研究

基于LpxC和NO双靶点的抗菌先导物的设计、合成与活性研究

利用组合生物催化技术探索一种研究五环三萜类化合物结构与功能的新方法

HNE介导自噬调控慢性鼻-鼻窦炎中MUC5AC表达的作用及机制研究

人嗜中性粒细胞弹性蛋白酶在慢性鼻-鼻窦炎中黏蛋白过度表达中的作用及机制研究

复杂运动条件下认知能力和运动技能学习能力的神经心理机制研究

脱细胞基质生物材料DNA去除标准和免疫原性研究

基于自主支持背景的情感与员工创造性绩效的关系研究

脑血栓候选新药磷脂酰丝氨酸脑靶向脂质体的实验研究

国家重点研发计划绩效评价：理论框架与实证研究

敦煌南湖湿地植物-土壤碳氮磷化学计量比空间格局分异规律研究

基于PMD/2D混合维度视觉系统的移动机器人三维SLAM研究

五味子科植物花性别分化的分子机制和进化规律研究

血管神经化、具备收缩能力的新型腹壁修复材料的构建

基于自我决定理论的创造性组织情境的动机机制研究

利用骨骼肌全器官脱细胞基质再生功能性大体积骨骼肌的实验研究

二维费米原子气体的普适行为研究

肠道菌群-TLR5-IL-6在肝癌中的作用及机制研究

复杂运动条件下动作表象的神经心理机制研究

相似国自然基金

基于结构建模的语音理解及应用研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

石萆汤对弱精子症患者精子线粒体膜蛋白PHB及超微结构的影响

张剑的其他基金

工作激情影响员工创造性绩效的因果环机制研究：引入动态计算理论的分析

鸡CCT基因克隆及其与蛋黄卵磷脂生物合成关系的研究

融合时空约束与先验知识的表演驱动的人脸动画生成

hVPS52（高尔基体相关逆向转运复合体亚基）作为潜在抑癌基因的验证及机制探究

转移CTLA4Ig和CD40LIg双基因修饰骨髓间充质干细胞诱导大鼠肝移植免疫耐受

新型氢键型二维层状材料MOHXenes的制备及高压研究

基于LpxC和NO双靶点的抗菌先导物的设计、合成与活性研究

利用组合生物催化技术探索一种研究五环三萜类化合物结构与功能的新方法

HNE介导自噬调控慢性鼻-鼻窦炎中MUC5AC表达的作用及机制研究

人嗜中性粒细胞弹性蛋白酶在慢性鼻-鼻窦炎中黏蛋白过度表达中的作用及机制研究

复杂运动条件下认知能力和运动技能学习能力的神经心理机制研究

脱细胞基质生物材料DNA去除标准和免疫原性研究

基于自主支持背景的情感与员工创造性绩效的关系研究

脑血栓候选新药磷脂酰丝氨酸脑靶向脂质体的实验研究

国家重点研发计划绩效评价：理论框架与实证研究

敦煌南湖湿地植物-土壤碳氮磷化学计量比空间格局分异规律研究

基于PMD/2D混合维度视觉系统的移动机器人三维SLAM研究

五味子科植物花性别分化的分子机制和进化规律研究

血管神经化、具备收缩能力的新型腹壁修复材料的构建

基于自我决定理论的创造性组织情境的动机机制研究

利用骨骼肌全器官脱细胞基质再生功能性大体积骨骼肌的实验研究

二维费米原子气体的普适行为研究

肠道菌群-TLR5-IL-6在肝癌中的作用及机制研究

复杂运动条件下动作表象的神经心理机制研究

相似国自然基金

基于SSR 的西南地区野生菰资源遗传多样性及遗传结构分析