基于深层神经网络的多模态快速稀疏表征器

基本信息
批准号:61473219
项目类别:面上项目
资助金额:82.00
负责人:王进军
学科分类:
依托单位:西安交通大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:汪建基,蒋怀祖,张世周,梁宇栋,陶小语,刘楠,禹庆华,侯骐麒
关键词:
稀疏表示特征提取多模态神经网络
结项摘要

Despite the recent progress in semantic multimedia analysis based on sparse feature representation, extracting sparse feature is still a time consuming process and is difficult to apply to multi-modalities situation. Due to the high non-linearity of the sparse-coding process, developing new mathematic algorithms to overcome the above two limitations is getting very difficult. Alternatively, in this proposal, based on the solid biological evidence that the human vision system also adopts sparse feature representation for natural visual data, we plan to develop deep artificial neural network based sparse feature representor to tackle the above dilemma. The representor solves the sparse-coding problem by performing simple feed-forward calculation, such that the feature representation process can achieve order-of-magnitude speed-up. Meanwhile, the representor allows multi-modality input by aligning and fusing different modality into joint sparse representation, such that it can handle some complex scenarios in typical large-scale image and video processing problems, including modality deficiency, off-synchronization, different spatio-temporal resolution, etc. Based on the developed representor, many novel applications can be well supported, such as modality deficiency robust feature representation, modality-invariant intrinsic feature extraction, visualization of low-level features, etc, which will dramatically improve the popularity of sparse feature representation technology in real-world, large-scale multimedia computing applications.

从多媒体数据中提取具有稀疏特性的特征表达尽管能够取得较好的语义分析效果,其仍具有计算量过大、难以支持多模态联合表征两个主要困难。由于求解稀疏约束条件的高度非线性,开发新的数学优化与融合算法突破上述限制变得越来越困难。课题组拟结合人类视觉系统在对自然图像信息表达过程中具有稀疏性这一生理学基础,采用人工深层神经网络模型开发快速稀疏表征器。该表征器支持以前馈方式直接快速"计算"输入信号的稀疏编码,实现特征提取速度超过一个数量级的提高。同时允许从多模态数据中进行跨模态对齐的稀疏表征,能够支持包括静态图像到动态视音频的大规模多媒体数据中常见的模态缺失、不同步、时空分辨率不匹配等复杂情况下的有效特征表达。在此基础上,衍生出一系列新颖的应用,包括对模态缺失状况的最优化处理、数据的模态无关性本征表达、抽象特征的可视化等功能,从而极大促进稀疏表征方法面向大规模复杂多模态数据的广泛应用。

项目摘要

从多媒体数据中提取具有稀疏特性的特征表达尽管能够取得较好的语义分析效果,其仍具有计算量过大、难以支持多模态联合表征两个主要困难。在本课题中,我们深入研究了如何在现有的深度网络中添加稀疏约束条件,构建了一种非卷机操作的深度网络模型,并在此基础上进一步研究了如何使用联合优化的方式,找到多个模型的联合特征表达方式。首先,我们提出了一种利用深度网络对L1稀疏编码的快速逼近方法,并以此为基础,采用线性编码操作替代了卷积操作,构建了一种新型的深度网络模型,在多个学术数据集上取得了显著的性能提升。在此基础上,我们研究了如何对多个模型进行有效的特征融合,提出了多种多模型融合策略,均取得了优于简单叠加多个模型的性能,并且进一步应用于跨摄像头重识别等问题,在极大地减少训练样本规模的同时,获得了不逊于全监督条件下所能达到的性能。这些理论成果,为后续的研究提供了新的参考和可行性。项目资助发表核心期刊论文14篇,顶级国际会议论文15篇。项目培养了硕士生8名(4名已毕业),博士生2名。项目投入经费82万元,支出80万元,剩余经费2万元,各项费用基本与预算相符合。剩余经费计划用于本项目研究后续支出。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

基于非线性接触刚度的铰接/锁紧结构动力学建模方法

基于非线性接触刚度的铰接/锁紧结构动力学建模方法

DOI:10.19447/j.cnki.11-1773/v.2021.06.005
发表时间:2021

王进军的其他基金

批准号:39800017
批准年份:1998
资助金额:11.00
项目类别:青年科学基金项目
批准号:81873877
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:31672049
批准年份:2016
资助金额:65.00
项目类别:面上项目
批准号:30170617
批准年份:2001
资助金额:19.00
项目类别:面上项目
批准号:30871631
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:31171851
批准年份:2011
资助金额:52.00
项目类别:面上项目
批准号:30570231
批准年份:2005
资助金额:29.00
项目类别:面上项目
批准号:30471173
批准年份:2004
资助金额:20.00
项目类别:面上项目
批准号:31871969
批准年份:2018
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

基于稀疏编码模型的深层学习神经网络

批准号:61273023
批准年份:2012
负责人:胡晓林
学科分类:F0601
资助金额:61.00
项目类别:面上项目
2

基于可学习Nestrov稀疏编码器的深层模型研究

批准号:61702323
批准年份:2017
负责人:姜锐
学科分类:F06
资助金额:23.00
项目类别:青年科学基金项目
3

基于多模态融合机制的视频语义表征方法研究

批准号:61702313
批准年份:2017
负责人:侯素娟
学科分类:F0210
资助金额:25.00
项目类别:青年科学基金项目
4

基于多模态深层交互编码的小样本高光谱遥感影像分类方法研究

批准号:61901198
批准年份:2019
负责人:梁苗苗
学科分类:F0113
资助金额:25.00
项目类别:青年科学基金项目