基于图像集合和深度学习的物体分类关键技术研究

基本信息
批准号:61662014
项目类别:地区科学基金项目
资助金额:33.00
负责人:徐智
学科分类:
依托单位:桂林电子科技大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:温佩芝,郑卓远,沈嘉炜,苗渊渊,周迎
关键词:
深度监督网络深度反馈网络图像集合分类深度学习物体分类
结项摘要

Object classification/recognition has been a fundamental and important issue in computer vision. Classification is the base for high level vision task, such as object segment, tracking, action analysis, etc. Currently, it faces many challenges including variations of scale, illumination, viewpoints and occlusion. Those images in set could achieve the information complementation, which will contribute to improve the performance of classification. Image set based classification, however, still needs to solve three significant problems: (1) Different image sets are of imbalance; (2) Accuracy of classification is sensitive to outliers, and image sets usually are pretty high redundancy. (3) So far, we lack of effective scheme on extracting discriminative features. For the sake of those problems, we propose object classification based on image set and deep learning. We focus on mainly three aspects: (a) Construct the over-complete features representation based on second order tensor; (b) Utilize mutual representation among images to detect outliers and find representative images to compress data in image set; (c) Study the strategies about extracting the discriminative and abstract features for object classification.

图像物体分类、识别一直以来是计算机视觉研究中的重要问题,是图像分割、物体跟踪、行为分析等其它高层视觉任务的基础。然而,物体分类仍面临许多的挑战,主要包括尺度、光照和视角变化,遮挡等。采用基于集合的物体分类方法,通过集合内信息互补,上述问题有望得到解决。目前,图像集合分类中主要面临三个迫切需要解决的问题:(1) 分类集合的不平衡性问题;(2) 集合信息冗余度高,分类易受离群点干扰;(3) 缺乏集合层次的判别特征提取方法,分类效果不理想。针对上述问题,我们提出基于图像集合与深度学习的物体分类方法,研究的重点内容包括:(a) 研究二阶张量下的过完备特征表示建模,解决集合不平衡性问题; (b) 研究集合图像的语义互表示建模集,去除离群点,实现集合的紧致表示; (c) 研究集合层次判别特征的提取与分类建模,提高物体分类精度。本项目的研究成果将为物体识别技术的应用提供理论支持与技术保障。

项目摘要

图像中物体的分类、识别是计算机视觉研究中的重要问题,是图像分割、目标检测、跟踪与行为分析等其它高层视觉任务的基础。然而,物体分类仍面临许多的挑战,主要包括尺度、光照和视角变化,遮挡以及数据的长尾分布等。我们采用基于集合的物体分类方法,通过集合内信息互补,结合深度学习方法研究了图像中物体的分类。针对视频人脸识别,我们采用稀疏表示选择最具代表性的人脸形成人脸库图像集合,用将视频中抓拍的多张人脸形成图像集合,比较集合之间的相似性,实现视频人脸识别。实验结果表明我们的算法比同类算法分类精度更高,鲁棒性更强。针对人脸分类、识别中与目标域分布相同的训练数据不足的问题,课题组提出了域自适应的泛化学习框架。构造多个子空间,将与待识别人脸类别不同的人脸数据集作为训练集,识别测试集中人脸图像,提升了识别精度。我们提出了库敏感的单样本人脸识别方法,可有效利用不同域训练数据的标签信息,充分利用源域信息的迁移,实现人脸的分类、识别。. 针对高级视觉任务如运动目标分类、检测,课题组并设计了一种用于复杂场景中运动目标分类与检测的深度帧差卷积神经网络,实验表明在复杂背景下,该方法具有很强的鲁棒性,对小目标也具有较好的检测分类效果。. 在高光谱图像分类问题上,我们提出加权K均值近邻与多任务学习稀疏表示相结合的方法,该方法充分利用图像像元在空间上的相关性,结合多任务学习稀疏表示,可缓解训练样本不足导致的欠拟合问题,实现目标物的检测。由于在监督学习中,标签噪声普遍存在,我们提出了基于核熵成分分析的监督学习方法,可去除标签噪声,实现鲁棒分类。针对噪声标签检测,我们提出了分层能量最小限制机制,可有效探测、去除标签噪声样本,提高分类精度。. 在本项目的支持下,课题组在可见光图像和高光谱图像分类领域均取得一些重要成果,图像分类为我们与此相关的应用奠定了基础,如视频监控下目标检测与跟踪,高光谱图像分类、噪声标签检测、异常检测等。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
5

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019

徐智的其他基金

批准号:31760609
批准年份:2017
资助金额:40.00
项目类别:地区科学基金项目
批准号:30500230
批准年份:2005
资助金额:25.00
项目类别:青年科学基金项目
批准号:81370057
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:81000880
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:81070053
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:81370169
批准年份:2013
资助金额:65.00
项目类别:面上项目

相似国自然基金

1

基于深度学习的高分遥感图像解译关键技术研究

批准号:61563053
批准年份:2015
负责人:董峦
学科分类:F0604
资助金额:39.00
项目类别:地区科学基金项目
2

融合稀疏表示与深度学习的图像分类技术研究

批准号:61303154
批准年份:2013
负责人:张淳杰
学科分类:F0605
资助金额:28.00
项目类别:青年科学基金项目
3

基于图像属性和深度学习的大规模物体检测研究与应用

批准号:61503366
批准年份:2015
负责人:罗平
学科分类:F0601
资助金额:21.00
项目类别:青年科学基金项目
4

基于深度学习的复杂图像显著物体检测方法研究

批准号:61473231
批准年份:2014
负责人:韩军伟
学科分类:F0604
资助金额:82.00
项目类别:面上项目