基于卷积神经网络和双层优化建模的复杂图像分类研究

基本信息

批准号：61702163

项目类别：青年科学基金项目

资助金额：27.00

负责人：谢国森

学科分类：

依托单位：河南科技大学

批准年份：2017

结题年份：2020

起止时间：2018-01-01 - 2020-12-31

项目状态：已结题

项目参与者：宋斌,梁灵飞,高计委,李孟祥,司彦娜,张思达

关键词：

卷积神经网络多标签分类双层优化细粒度分类特征学习

结项摘要

Convolutional Neural Network (CNN) models have achieved tremendous progress in traditional object categorization task,and CNN has been the powerful tool for image analysis.Towards more complex image types, such as fine-grained images, how to develop high accurate image recognition system is one challenging research topic.This project studies the complex image classification tasks, e.g.,fine-grained and multi-label classification, based on CNN and Bilevel optimization models. The main contents are:（1) research on unsupervised part and global object discovery algorithms, then the joint training CNN architecture with local and global information is constructed; (2) research on label hierarchical structure, then super class regularizations are constructed, and finally fusing the label hierarchical structure into the training process of CNN; (3) research on discriminative pooling method of convolutional layer feature in CNN, based on Bilevel modeling. This project will be conducted on the basis of our previous research and try to achieve the goal of further improving recognition accuracy and promoting the real applications. This project has wide academic value and application prospect.

卷积神经网络（CNN）模型在经典物体分类任务中已经取得巨大成功，并成为了图像分析的有力工具。面向更复杂的图像类型，比如细粒度图像，如何基于CNN模型开发出高精度的识别系统是一项具有挑战性的研究课题。本项目拟基于CNN和双层优化模型，对细粒度、多标签等复杂图像的分类任务开展深入研究，具体包括：（1）研究非监督的部件、全局目标发现算法，构建局部协同整体进行联合训练的CNN网络；（2）研究细粒度图像的标签层级结构，构建超类正则，并将层级标签结构信息加入CNN训练中；（3）研究基于双层优化的CNN卷积特征的判别汇聚算法。本项目在前期扎实的工作基础上开展，以提升识别性能、推动实际应用为目的，具有广泛的应用前景和学术价值。

项目摘要

图像分类技术是计算机视觉研究的核心内容，是实现机器智能的必要手段。随着计算机运算能力的空前发展、海量数据的积累以及人们对自动作业的极大渴求，深度学习得到了前所未有的发展；尤其是基于卷积神经网络（CNN）模型的图像分类系统也获得了空前成功。然而面向更复杂的图像类型和更少的图片数量，开发出有效的和高精度的图像识别系统仍然是具有很强挑战性的研究课题。本项目围绕复杂图像的分类任务开展深入研究，主要取得了如下研究成果：提出基于非监督部件发现的、局部协同整体的图像识别统一CNN框架；提出基于标签层级结构建模的复杂图像分类算法；提出基于部件、样本结构化建模的嵌入式和生成式复杂图像分类算法；研究了若干下游任务，目的是为了服务于我们的核心目标，即提升复杂图像分类系统的性能。本项目的顺利完成，将为机器智能和作业自动化的发展带来助力，为计算机视觉的进步增砖添瓦。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3788/CJL201946.0801003

发表时间：2019

谢国森的其他基金

相似国自然基金

基于门控卷积神经网络和长期记忆建模的复杂文本分类模型研究

批准号：61806142

批准年份：2018

负责人：金日泽

学科分类：F0601

资助金额：20.00

项目类别：青年科学基金项目

基于深度卷积神经网络构建场景部件的场景图像分类研究

批准号：61602027

批准年份：2016

负责人：白双

学科分类：F0605

资助金额：20.00

项目类别：青年科学基金项目

针对图像分类的卷积神经网络的压缩方法研究

批准号：61876007

批准年份：2018

负责人：许超

学科分类：F0604

资助金额：64.00

项目类别：面上项目

视觉分类任务中基于高阶统计建模的深层卷积神经网络方法研究

批准号：61806140

批准年份：2018

负责人：王旗龙

学科分类：F0604

资助金额：26.00

项目类别：青年科学基金项目

基于卷积神经网络和双层优化建模的复杂图像分类研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于腔内级联变频的0.63μm波段多波长激光器

谢国森的其他基金

相似国自然基金