基于深度图像特征图谱的多标签图像识别技术研究

基本信息

批准号：61572214

项目类别：面上项目

资助金额：65.00

负责人：王天江

学科分类：

依托单位：华中科技大学

批准年份：2015

结题年份：2019

起止时间：2016-01-01 - 2019-12-31

项目状态：已结题

项目参与者：段葵,冯琪,刘芳,许春燕,舒禹程,邵光普,王明理,冯平,罗张

关键词：

特征图谱多标签图像识别深度学习视觉显著性分析

结项摘要

Multi-label image contains multiple visual semantic objects, and these objects usually have different scale, position, gesture, and category. The recognition of multi-label image is a very important research direction. Although the deep learning algorithm has achieved a leading progress, but now it is more suitable for the recognition of single-label images. Few multi-label image recognition algorithm were proposed to connect the deep learning process with the traditional object extraction method, which failed to utilize the inherent deep feature maps generated during the deep learning, thus lack of initiative and effectiveness. Therefore, we propose to study the multi-label image recognition method based on deep image feature maps. By obtaining an integrated multi-label image classification model, we can complete multi-label feature learning, analysis, and classification tasks under an unified framework without extra single label object extraction steps. Firstly, visual saliency analysis is proposed based on the inherent multi-scale feature maps during the deep learning process, which results in multiple saliency areas. Then, a comprehensive semantics reconstruction procedure is proposed based on regional image characteristics and spatial pyramid coding algorithm. Finally, the deep learning classification process is introduced. What's more, the feature map analysis and multi-label image recognition process are constraint and optimized by regularizing the learning of deep neural network based on multi-loss function. The research results not only have important theoretical significance in the field of computer vision but also have broad application prospects.

多标签图像包含多个尺度、位置、姿态、类别各不相同的视觉语义对象，对其进行识别是一个重要的研究方向。目前领先的深度学习算法只适用于单标签图像识别，最近有论文将传统的对象区域提取方法串联深度学习过程，用于多标签图像识别，但其没有利用深度学习过程中内在的特征图谱，识别效率低、效果不够好。因此，本课题将基于深度图像特征图谱，研究多标签图像识别技术，获得一体化的多标签图像分类模型，在一个框架下统一完成多标签特征图谱学习、分析和分类任务，无需额外的对象预提取过程。首先，对深度学习中内在多尺度特征图谱进行视觉显著性分析，得到多个显著性区域；然后，基于区域局部特征图谱与空间金字塔编码进行综合语义重构；最后进行深度学习分类。同时在深度特征图谱分析和深度学习分类过程中，还采用多损失函数分别进行约束与优化，实现深度神经网络规则化学习。本课题研究成果不仅具有重要的理论意义，在计算机视觉相关领域也具有广泛的应用前景

项目摘要

本项目基于深度学习框架，利用其很好的单标签图像分类特性，提出新的多标签图像识别模型。本项目首先基于多尺度深度图像特征图谱进行显著性分析，得到多目标显著性区域，从而把显著性检测方法用于多标签图像分类任务上。相对于一般对象检测方法得到大量的候选区域，基于特征图谱进行多尺度的显著性检测能够极大地避免基于整幅图像的稠密对象检测，提高算法的运行效率。同时，在获得显著性区域后，本项目将利用空间金字塔编码模式进行进一步综合语义重构，对图像内容进行更加全面、综合地表征。而后，我们提出最小化多个损失函数来共同优化深度卷积神经网络的共有部分。基于多任务的深度学习，一方面能够高效优化卷积神经网络参数，防止因为拟合一种图像属性而引起的过拟合现象，另一方面仅利用一个神经网络流程，就可以同时得到多个图像属性，可以有效的从多个方面进行多标签图像识别。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

王天江的其他基金

批准号：61073094

批准年份：2010

资助金额：32.00

项目类别：面上项目

相似国自然基金

基于层次深度网络混合模型的图像识别技术研究

批准号：61806063

批准年份：2018

负责人：匡振中

学科分类：F0604

资助金额：28.00

项目类别：青年科学基金项目

基于多视角的网络暴力敏感图像识别技术研究

批准号：61672130

批准年份：2016

负责人：冯林

学科分类：F0205

资助金额：63.00

项目类别：面上项目

基于多标签语义本体的图像深度哈希学习新方法研究

批准号：61702419

批准年份：2017

负责人：夏召强

学科分类：F0210

资助金额：25.00

项目类别：青年科学基金项目

基于深度特征学习的翻拍图像检测技术研究

批准号：61901349

批准年份：2019

负责人：朱楠

学科分类：F0116

资助金额：20.00

项目类别：青年科学基金项目

基于深度图像特征图谱的多标签图像识别技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于多色集合理论的医院异常工作流处理建模

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于腔内级联变频的0.63μm波段多波长激光器

王天江的其他基金

基于李群论的广义高斯分布型图像特征分析研究

相似国自然基金