With the arrival of the era of artificial intelligence, the demand of smart vision perception has become increasingly prominent, and large scale image classification is considered as one of the core contents of vision perception. Though existing image classification methods can already handle large-scale data and plenty of classes, they neglect the hidden hierarchical structure of image data and thus cannot satisfy the practical application demands in terms of classification accuracy and efficiency. Therefore, this project aims at a breakthrough in this field, with significant improvement of both accuracy and efficiency, by the study on essential theories and methods of hierarchical learning. Firstly, we will establish a knowldege-driven hiearchical classification model for large scale image classification, which is expected to overcome the challenges of unbalanced distribution of image classes and high computational complexity of the classification model, so as to lay the theoretic foundation for hierarchical classification. Secondly, we will study the following key techniques: knowledge-driven hiearchical structure construction, the feature learning for both image classification and hiearchical structure construction, and the hiearchical classification measurement. Furthermore, we will develop a prototype system to verify the proposed the theories and techniques on various and different kinds of large image classification datasets. The study shall explore and verify in a scientific way the theoretical and applied significance of hierarchical learning in large scale image classification. Meanwhile, it can open up a new direction and provide the key techniques for the more general big data processing and labeling problems.
人工智能的发展对智能视觉感知的需求日益迫切,而图像分类是视觉感知的核心内容之一,且应用广泛。当前的图像分类方法虽已能处理大规模超多类数据,却忽视了其中隐含的类层次结构信息,从而导致性能和效率受限,无法满足现实需求。因此本项目旨在通过层次化学习理论和方法研究来取得这一领域的突破,提高分类精度和执行效率。研究内容:首先,建立知识驱动的大规模图像分层分类模型,解决大规模图像分类任务中类别分布不均衡、模型复杂度高等难题,奠定分层分类的理论基础;其次,探讨分类模型中层次化结构构建、面向分类和聚类的深度特征学习以及分层分类评价指标等关键技术;最后,在多个具有不同特点的大规模图像库上进行实例验证。这一研究将从科学角度探讨和验证层次化学习在大规模图像分类中的理论与应用价值,并为更具一般性的大数据分析与标注问题提供新的解决思路和关键技术支撑。
人工智能的发展对智能视觉感知的需求日益迫切,而图像分类是视觉感知的核心内容之一,且应用广泛。当前的图像分类方法虽已能处理大规模超多类数据,却忽视了其中隐含的类层次结构信息,从而导致性能和效率受限,无法满足现实需求。因此本项目旨在通过层次化学习理论和方法研究来取得这一领域的突破,提高分类精度和执行效率。研究内容包括:1)建立知识驱动的大规模图像分层分类模型,解决大规模图像分类任务中类别分布不均衡、模型复杂度高等难题,奠定分层分类的理论基础;2)探讨分类模型中层次化结构构建、面向分类和聚类的深度特征学习以及分层分类评价指标等关键技术;3)在多个具有不同特点的大规模图像库上进行实例验证。研究成果包括1)实现了“知识驱动+层次化学习”图像分类模型,利用概念本体知识,设计分层稀疏表示学习机制,形成视觉树,将最优路径求解作为分层分类指标预测图像分类标号。将该理论应用于高分辨率图像图像语义分割,构造了块推荐机制驱动的整体和局部分层学习的高分辨率语义分割模型,实现了单张GPU卡就能处理超过6M的高分辨率图像分割。设计了基于元学习知识驱动的多尺度层次化学习方法,仅通过一个主干框架就能实现三个尺度的语义分割;构造了整体-局部双重互学习驱动的超大图分割模型,进一步提高了算法的速度。2)为解决层次结构学习,研究多视图自表示聚类方法,构造了基于核化张量分解及其施加基几何约束、基于深度学习三种多视图自表示聚类方法;构造了了基于聚类和分类联合学习模型;基于知识蒸馏的自提升模型、对抗学习层次化特征学习模型等。所提方法均在既定数据集和当前流行的数据集上进行验证。发表论文40篇,获奖10项,包括JCR一区3篇、二区6篇,CCF-A类会议论文24篇,完成既定研究任务。 该研究从科学角度探讨和验证“知识驱动+层次化学习”在大规模图像分类中的理论与应用价值,有望在公共安全、交通安全和国防安全上发挥作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
内点最大化与冗余点控制的小型无人机遥感图像配准
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
层次化虹膜图像分类方法
基于层次化表达的大规模图像物体识别
大规模稀疏迁移学习理论及其在SAR图像分类中的应用
基于大规模弱标注图像的分类器学习新方法研究