基于多视角语义协同的细粒度图像分类

基本信息
批准号:61872362
项目类别:面上项目
资助金额:16.00
负责人:张淳杰
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2018
结题年份:2019
起止时间:2019-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:李成华,王培松,胡庆浩,王家兴,谌强,赵天理,李钢
关键词:
多视角协同图像识别图像理解细粒度图像分类
结项摘要

Fine-grained image classification has become very popular in recent years. It aims to make accurate classification of images of several sub-categories which belong to the same large category. The state-of-the-art fine-grained classification methods use visual information directly without considering the semantic information. Besides, it would be effective to combine the discriminative information of multiple views. This project plans to conduct research on the fine-grained image classification problem by using multi-view semantic collaboration. The main contents of our research can be summarized as follows. In order to make use of the semantic representations, we model objects and their context information to get discriminative single view representation. The training images are expanded with unlabeled images which has view consistent predictions. This project aims to make correct classfication of fine-grained images and improve the classification performance. This project will publish about five high influence papers on international journals and conferences and also foster one to two students with master or PhD degree. This project reveals the influences of semantic information and multi-view representation for fine-grained image classification. This project will make breakthrough on the model, method and key technology of fine-grained image classification.

对细粒度图像进行准确分类是近几年的一个研究热点。它的目标是对一个大类中的若干个子类图像进行准确识别。现有的细粒度图像分类方法大多直接基于视觉信息分类,缺乏对于图像语义信息的充分利用;另外,综合多种视角信息可以更好地改进分类性能。本项目研究基于多视角语义协同的细粒度图像分类方法。主要研究内容包括两方面:一方面,基于语义表示,对物体及其上下文信息进行建模,从而得到有判别力的单视角图像表示;另一方面,基于多视角一致性约束,选取不同视角观测一致的未标记图像对训练图像进行扩增。项目实现对于细粒度图像类别的精细预测,改进细粒度图像分类性能。将在高水平国际期刊及高水平学术会议上发表论文5篇左右,培养博士、硕士研究生1-2名。在科学意义方面,本项目揭示语义信息和多视角表示对于细粒度图像分类的影响,在细粒度图像分类模型、方法和关键技术上实现突破。.

项目摘要

细粒度图像分类是对一个大类中的若干个子类图像进行准确识别。现有的细粒度图像分类方法大多直接基于视觉信息分类,缺乏对于图像语义信息的充分利用;另外,综合多种视角信息可以更好地改进分类性能。本项目研究基于多视角语义协同的细粒度图像分类方法。主要研究内容包括两方面:一方面,基于语义表示,对物体及其上下文信息进行建模,从而得到有判别力的单视角图像表示;另一方面,基于多视角一致性约束,选取不同视角观测一致的未标记图像对训练图像进行扩增。项目实现对于细粒度图像类别的精细预测,改进细粒度图像分类性能。主要进展有三项。一、针对物体、上下文语义表示构建问题,提出了一种融合视觉、语义和视角一致的多视角图像分类策略;二、针对语义表示构建问题,提出了一种多视角语义表示的视觉分类方法;三、针对标注图像扩增问题,提出了一种基于弱语义一致性的半监督、无监督图像分类方法。在高水平国际期刊发表论文5篇,包括IEEE Transactions on Image Processing 1篇、IEEE Transactions on Cybernetics 1篇、IEEE Transactions on Multimedia 2篇、IEEE Transactions on Circuits and System for Video Technology 1篇。培养博士研究生1名、硕士研究生2名。项目负责人张淳杰受邀担任国际期刊Information Sciences(2019年Impact factor:5.524)编委(associate editor)、IJCAI 2020程序委员会委员。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021

张淳杰的其他基金

批准号:61303154
批准年份:2013
资助金额:28.00
项目类别:青年科学基金项目

相似国自然基金

1

资源受限的细粒度图像分类

批准号:61772256
批准年份:2017
负责人:吴建鑫
学科分类:F0210
资助金额:61.00
项目类别:面上项目
2

基于深度学习的细粒度图像分类识别方法研究

批准号:61702197
批准年份:2017
负责人:骆威
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
3

基于稀疏语义表示的大规模图像分类问题研究

批准号:61262050
批准年份:2012
负责人:李波
学科分类:F0210
资助金额:46.00
项目类别:地区科学基金项目
4

基于多视角融合的社交网络图像语义学习与搜索技术研究

批准号:61802028
批准年份:2018
负责人:薛哲
学科分类:F0210
资助金额:27.00
项目类别:青年科学基金项目