基于图像集合和深度学习的物体分类关键技术研究

基本信息

批准号：61662014

项目类别：地区科学基金项目

资助金额：33.00

负责人：徐智

学科分类：

依托单位：桂林电子科技大学

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：温佩芝,郑卓远,沈嘉炜,苗渊渊,周迎

关键词：

深度监督网络深度反馈网络图像集合分类深度学习物体分类

结项摘要

Object classification/recognition has been a fundamental and important issue in computer vision. Classification is the base for high level vision task, such as object segment, tracking, action analysis, etc. Currently, it faces many challenges including variations of scale, illumination, viewpoints and occlusion. Those images in set could achieve the information complementation, which will contribute to improve the performance of classification. Image set based classification, however, still needs to solve three significant problems: (1) Different image sets are of imbalance; (2) Accuracy of classification is sensitive to outliers, and image sets usually are pretty high redundancy. (3) So far, we lack of effective scheme on extracting discriminative features. For the sake of those problems, we propose object classification based on image set and deep learning. We focus on mainly three aspects: (a) Construct the over-complete features representation based on second order tensor; (b) Utilize mutual representation among images to detect outliers and find representative images to compress data in image set; (c) Study the strategies about extracting the discriminative and abstract features for object classification.

图像物体分类、识别一直以来是计算机视觉研究中的重要问题，是图像分割、物体跟踪、行为分析等其它高层视觉任务的基础。然而，物体分类仍面临许多的挑战，主要包括尺度、光照和视角变化，遮挡等。采用基于集合的物体分类方法，通过集合内信息互补，上述问题有望得到解决。目前，图像集合分类中主要面临三个迫切需要解决的问题：(1) 分类集合的不平衡性问题；(2) 集合信息冗余度高，分类易受离群点干扰；(3) 缺乏集合层次的判别特征提取方法，分类效果不理想。针对上述问题，我们提出基于图像集合与深度学习的物体分类方法，研究的重点内容包括：(a) 研究二阶张量下的过完备特征表示建模，解决集合不平衡性问题； (b) 研究集合图像的语义互表示建模集，去除离群点，实现集合的紧致表示； (c) 研究集合层次判别特征的提取与分类建模，提高物体分类精度。本项目的研究成果将为物体识别技术的应用提供理论支持与技术保障。

项目摘要

图像中物体的分类、识别是计算机视觉研究中的重要问题，是图像分割、目标检测、跟踪与行为分析等其它高层视觉任务的基础。然而，物体分类仍面临许多的挑战，主要包括尺度、光照和视角变化，遮挡以及数据的长尾分布等。我们采用基于集合的物体分类方法，通过集合内信息互补，结合深度学习方法研究了图像中物体的分类。针对视频人脸识别，我们采用稀疏表示选择最具代表性的人脸形成人脸库图像集合，用将视频中抓拍的多张人脸形成图像集合，比较集合之间的相似性，实现视频人脸识别。实验结果表明我们的算法比同类算法分类精度更高，鲁棒性更强。针对人脸分类、识别中与目标域分布相同的训练数据不足的问题，课题组提出了域自适应的泛化学习框架。构造多个子空间，将与待识别人脸类别不同的人脸数据集作为训练集，识别测试集中人脸图像，提升了识别精度。我们提出了库敏感的单样本人脸识别方法，可有效利用不同域训练数据的标签信息，充分利用源域信息的迁移，实现人脸的分类、识别。. 针对高级视觉任务如运动目标分类、检测，课题组并设计了一种用于复杂场景中运动目标分类与检测的深度帧差卷积神经网络，实验表明在复杂背景下，该方法具有很强的鲁棒性，对小目标也具有较好的检测分类效果。. 在高光谱图像分类问题上，我们提出加权K均值近邻与多任务学习稀疏表示相结合的方法，该方法充分利用图像像元在空间上的相关性，结合多任务学习稀疏表示，可缓解训练样本不足导致的欠拟合问题，实现目标物的检测。由于在监督学习中，标签噪声普遍存在，我们提出了基于核熵成分分析的监督学习方法，可去除标签噪声，实现鲁棒分类。针对噪声标签检测，我们提出了分层能量最小限制机制，可有效探测、去除标签噪声样本，提高分类精度。. 在本项目的支持下，课题组在可见光图像和高光谱图像分类领域均取得一些重要成果，图像分类为我们与此相关的应用奠定了基础，如视频监控下目标检测与跟踪，高光谱图像分类、噪声标签检测、异常检测等。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

徐智的其他基金

批准号：31760609

批准年份：2017

资助金额：40.00

项目类别：地区科学基金项目

批准号：30500230

批准年份：2005

资助金额：25.00

项目类别：青年科学基金项目

批准号：81370057

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：81000880

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：81070053

批准年份：2010

资助金额：33.00

项目类别：面上项目

批准号：81370169

批准年份：2013

资助金额：65.00

项目类别：面上项目

相似国自然基金

基于深度学习的高分遥感图像解译关键技术研究

批准号：61563053

批准年份：2015

负责人：董峦

学科分类：F0604

资助金额：39.00

项目类别：地区科学基金项目

融合稀疏表示与深度学习的图像分类技术研究

批准号：61303154

批准年份：2013

负责人：张淳杰

学科分类：F0605

资助金额：28.00

项目类别：青年科学基金项目

基于图像属性和深度学习的大规模物体检测研究与应用

批准号：61503366

批准年份：2015

负责人：罗平

学科分类：F0601

资助金额：21.00

项目类别：青年科学基金项目

基于深度学习的复杂图像显著物体检测方法研究

批准号：61473231

批准年份：2014

负责人：韩军伟

学科分类：F0604

资助金额：82.00

项目类别：面上项目

基于图像集合和深度学习的物体分类关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

信息熵-保真度联合度量函数的单幅图像去雾方法

徐智的其他基金

有机肥DOM性质影响化肥氮利用的土壤生物学机制

LBP与CD14结合位点的精确定位及其模拟肽对内毒素性急性肺损伤治疗作用的实验研究

Hippo-YAP信号通路相关基因遗传变异与肝癌预后的关系及其机制研究

PPM1D介导YAP脱磷酸化对肝癌侵袭能力的影响及其机制研究

LBP/CD14结合位点基因多态性与内毒素易感性关系的研究及其拮抗多肽的筛选

CD14与LPS/LBP复合物结合位点的定位及抗内毒素小分子药物的筛选

相似国自然基金