Convolutional Neural Network (CNN) models have achieved tremendous progress in traditional object categorization task,and CNN has been the powerful tool for image analysis.Towards more complex image types, such as fine-grained images, how to develop high accurate image recognition system is one challenging research topic.This project studies the complex image classification tasks, e.g.,fine-grained and multi-label classification, based on CNN and Bilevel optimization models. The main contents are:(1) research on unsupervised part and global object discovery algorithms, then the joint training CNN architecture with local and global information is constructed; (2) research on label hierarchical structure, then super class regularizations are constructed, and finally fusing the label hierarchical structure into the training process of CNN; (3) research on discriminative pooling method of convolutional layer feature in CNN, based on Bilevel modeling. This project will be conducted on the basis of our previous research and try to achieve the goal of further improving recognition accuracy and promoting the real applications. This project has wide academic value and application prospect.
卷积神经网络(CNN)模型在经典物体分类任务中已经取得巨大成功,并成为了图像分析的有力工具。面向更复杂的图像类型,比如细粒度图像,如何基于CNN模型开发出高精度的识别系统是一项具有挑战性的研究课题。本项目拟基于CNN和双层优化模型,对细粒度、多标签等复杂图像的分类任务开展深入研究,具体包括:(1)研究非监督的部件、全局目标发现算法,构建局部协同整体进行联合训练的CNN网络;(2)研究细粒度图像的标签层级结构,构建超类正则,并将层级标签结构信息加入CNN训练中;(3)研究基于双层优化的CNN卷积特征的判别汇聚算法。本项目在前期扎实的工作基础上开展,以提升识别性能、推动实际应用为目的,具有广泛的应用前景和学术价值。
图像分类技术是计算机视觉研究的核心内容,是实现机器智能的必要手段。随着计算机运算能力的空前发展、海量数据的积累以及人们对自动作业的极大渴求,深度学习得到了前所未有的发展;尤其是基于卷积神经网络(CNN)模型的图像分类系统也获得了空前成功。然而面向更复杂的图像类型和更少的图片数量,开发出有效的和高精度的图像识别系统仍然是具有很强挑战性的研究课题。本项目围绕复杂图像的分类任务开展深入研究,主要取得了如下研究成果:提出基于非监督部件发现的、局部协同整体的图像识别统一CNN框架;提出基于标签层级结构建模的复杂图像分类算法;提出基于部件、样本结构化建模的嵌入式和生成式复杂图像分类算法;研究了若干下游任务,目的是为了服务于我们的核心目标,即提升复杂图像分类系统的性能。本项目的顺利完成,将为机器智能和作业自动化的发展带来助力,为计算机视觉的进步增砖添瓦。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于门控卷积神经网络和长期记忆建模的复杂文本分类模型研究
基于深度卷积神经网络构建场景部件的场景图像分类研究
针对图像分类的卷积神经网络的压缩方法研究
视觉分类任务中基于高阶统计建模的深层卷积神经网络方法研究