基于深度学习的文本和语音多模态数据挖掘研究

基本信息

批准号：61672301

项目类别：面上项目

资助金额：62.00

负责人：裴志利

学科分类：

依托单位：内蒙古民族大学

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：姜明洋,廉洁,宋琳琳,王庆虎,张红梅,周玉新,崔嘉乐,邱爽

关键词：

多模态语音数据挖掘深度学习文本

结项摘要

Currently, more and more multi-modal cross-media (text, audio, image, video) appears, and there is a strong correlation between the different modes of informatio at a semantic level. Low-dimensional features of single-mode data can be extracted by deep learning method, but it is not applicable to extrac multi-modal data features. In this project, a number based on multi-modal data feature extraction depth of learning, that is, text and voice data in multi-modal data text and voice, key research for text and voice multi-modal data depth learning model proposed jointly as enter the system model using the depth model to obtain the relevant attributes and relationships multimodal data (ie, consistency multimodal expression data), and to achieve multi-modal data classification, clustering, retrieval and identification.

现阶段，多模态的跨媒体信息（文本、声音、图像、视频）越来越多，不同模态信息间在某个语义层次上存在较强的关联，人们获取多模态数据低维特征的需求越来强烈，而面向单模态数据的深度学习方法，能够提取单模态数据的低维特征，但并不适用于多模态数据特征的提取。本项目针对于文本和语音的多模态数据，重点研究适用于文本和语音多模态数据的深度学习模型，提出若干基于深度学习的多模态数据特征提取方法，即文本和语音数据共同作为系统模型的输入，利用深度模型获得多模态数据的相关属性及关联关系（即多模态数据的一致性表达），并实现对多模态数据的分类、聚类、检索和识别。

项目摘要

本项目中，主要研究了SDAE算法在中文短文本分类的特征提取方面的应用。AE算法采取无监督学习和有监督微调的方式，它使用了反向传播算法(Back Propagation)，通过逐层训练，使输出值最大程度近似于输入值。SDAE是用多个DAE来构建深度神经网络模型，最顶层使用 Softmax 分类器。在训练过程中，输入一定是加入噪声的数据，微调时用原始数据对深度神经网络进行微调。栈式降噪自编码神经网络采用无监督逐层贪婪学习，通过干扰原始输入数据，从加入噪声的输入中学习得到更具鲁棒性的特征，经过实验证明本算法比其他几种经典算法具有更好的效果。但随着隐含层数、神经元个数以及稀疏程度的增加，现有的算法仍然不能避免进入局部极小值，以后的工作将会围绕此问题和参数调优等问题展开。.本项目研究了基于CNN的文本分类问题，构建了两种基于CNN的文本分类模型，并采用Reuters-21578数据集进行实验，实验结果表明构建的两种模型具有较好的分类性能。针对基于CNN的文本分类模型过拟合和训练耗时的问题，构建了基于稀疏Dropout卷积神经网络的文本分类模型(Sparse dropout constrained convolutional neural network，SDCNN)，该模型在训练时，通过引入Dropout和L1范数防止模型过拟合，减少训练时间，提高文本分类的准确率。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

裴志利的其他基金

批准号：61163034

批准年份：2011

资助金额：49.00

项目类别：地区科学基金项目

批准号：61373067

批准年份：2013

资助金额：77.00

项目类别：面上项目

相似国自然基金

基于深度学习和迁移学习的非结构化临床文本挖掘的方法探索

批准号：81771937

批准年份：2017

负责人：雷健波

学科分类：H2806

资助金额：60.00

项目类别：面上项目

基于深度学习的多源多模态城市大数据融合建模

批准号：61772342

批准年份：2017

负责人：彭敦陆

学科分类：F0202

资助金额：62.00

项目类别：面上项目

基于深度学习的数据-文本生成技术研究

批准号：61876004

批准年份：2018

负责人：常宝宝

学科分类：F0606

资助金额：62.00

项目类别：面上项目

基于深度学习的乳腺癌分子生物信息的文本挖掘研究

批准号：61502243

批准年份：2015

负责人：龚乐君

学科分类：F0213

资助金额：21.00

项目类别：青年科学基金项目

基于深度学习的文本和语音多模态数据挖掘研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

智能煤矿建设路线与工程实践

裴志利的其他基金

面向文本挖掘的特征选择关键问题研究

基于深度学习和主题模型的文本特征提取方法研究

相似国自然基金