Object detection is a fundamental problem in computer vision and pattern recognition and has wide applications. Fully supervised object detection has achieved great success in current mainstream datasets and challenges. But the fully supervised object detection usually requires big training data with full annotations including bounding boxes and object category labels. The annotation for object detection is usually very cost-intensive and hard to obtain in certain areas. In contrast, the human has the ability of few-shot learning, even zero-shot learning. There is very few works on object detection with little supervision, especially about mixed supervised object detection and very few-shot object detection. Motivated by this challenge, we try to address the problem of object detection with little supervision. The objective of this project is implementing a high-quality object detection system with as less supervision as possible. The project will absorb the neurocognitive laws and build up the computational model for domain invariant and discriminative objectness perception and knowledge transfer with little supervision, and finally improve object detection in the setting of little supervision. This project is both highly theoretical and practical.
物体检测是计算机视觉与模式识别中的基本问题之一,拥有极为广泛的应用。目前基于全监督的物体检测在当前主流数据库和竞赛中都取得了较好的性能。但是全监督物体检测需要大量的强标注样本(包括位置框和物体类别信息),而物体检测的标注代价往往较高,有些领域的物体标注样本还极难获取。与之相比,人类智能却具有小样本学习能力,往往通过极少新任务数据甚至零样本就能获得较好的认知。目前关于小样本条件下特别是混合监督和极小标注样本条件下的物体检测研究还较少。基于此,本项目拟对小样本条件下的物体检测进行深入研究。本项目的研究目标是利用尽可能少的标注信息包括标注信息不完整、标注样本少等情况,特别是在混合监督、极小标注样本条件下,实现高质量的物体检测。本项目的研究思路是借鉴认知神经科学中的一些认知机理,通过深入研究域无关判别物体性表征和小样本条件下的知识迁移,最终实现小样本条件下的物体检测,具有很强的理论性和实用性。
物体检测是计算机视觉与模式识别中的基本问题之一。现有的物体检测方法尽管已经取得了显著的进展,但对于小样本条件(特别是混合监督以及极小标注样本)下的物体检测仍没有很好解决。人类的小样本学习能力建立在不断积累的已有知识基础之上,即可以很好的利用已掌握的知识进行复用并迁移到新任务,大幅提高对新类别和新知识的学习能力。受此启发,本项目研究如何利用已有其他类别强标注数据知识实现新目标类的物体检测,也即混合监督物体检测和极小标注样本物体检测。针对当前算法图像裁剪速度较低的问题,我们提出了一种基于强化学习和对抗学习的弱监督图像自动裁剪模型。为提高高分辨率图像融合算法的性能,我们提出了基于高斯泊松生成对抗网络的学习框架,据我们所知,这是第一个探索生成对抗网络在高分辨率图像融合中应用的算法。在少镜头图像识别中,我们提出了一种新颖的面向小样本学习的知识迁移网络架构。针对多视角数据,我们提出新的多视角聚类的算法,可以有效进行非监督与半监督多视角语义学习。针对医学图像标注缺乏的问题,提出了一个多视角的特征金字塔网络。为降低医学图像标注成本,提出了切片级标签传播算法,可以为未标注数据自动生成可靠的病灶框。在图像自动裁剪中,提出了一个基于元学习的算法,其能够为不同的形状需求自适应的产生相应的结果。针对对抗样本攻击问题,提出了通用密集物体抑制的算法来针对检测器生成通用对抗扰动。本项目按照预订研究计划执行,在国际学术会议和期刊上发表论文17篇,其中国际顶级会议文章7篇(CVPR/ICCV/AAAI/ NeurIPS) ,国际主流会议5篇, 国际核心期刊3篇,国际主流期刊2篇,申请发明专利5项。本项目共协助培养博士毕业2名,硕士毕业1名,仍在读博士生3名,达到并超出预期研究成果。
{{i.achievement_title}}
数据更新时间:2023-05-31
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于全模式全聚焦方法的裂纹超声成像定量检测
服务经济时代新动能将由技术和服务共同驱动
原发性干燥综合征的靶向治疗药物研究进展
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
小样本条件下的物体识别与分割问题研究
复杂成像条件下道路场景物体检测的深度学习方法
小样本条件下潜艇机械噪声源识别研究
基于深度学习的零样本和小样本文本过滤技术研究