基于视觉注意力建模与深度特征金字塔网络的目标检测研究

基本信息

批准号：61703039

项目类别：青年科学基金项目

资助金额：24.00

负责人：朱超

学科分类：

依托单位：北京科技大学

批准年份：2017

结题年份：2020

起止时间：2018-01-01 - 2020-12-31

项目状态：已结题

项目参与者：王志明,侯杰波,刘畅,陈敏捷,任红萍

关键词：

特征提取目标检测深度学习视觉注意力

结项摘要

This project aims at visual object detection in images and videos, which is a challenging problem in the computer vision community. We plan to study on the new approaches for feature extraction and object detection by utilizing deep neural networks, which is now a powerful technique and tool in the field. More specifically, we are going to exploit the inherent multi-scale, pyramidal hierarchy of deep convolutional networks to construct feature pyramids with marginal extra cost. In this way, high-level semantic feature maps at all scales can be efficiently obtained. Moreover, we will introduce a visual attention model into deep neural networks so that a top-down action driven detection mechanism can be achieved. In this way, the context information surrounding a target object is also taken into consideration in order to achieve more accurate detections. The research outcomes are expected to promote the development of object detection and image content understanding, and could be applied for image and video content retrieval, intelligent video surveillance and other fields, providing necessary research foundation for efficient information retrieval and supervision in the era of big data and Internet.

本项目针对图像和视频中的视觉目标检测与识别这一计算机视觉领域的难点问题，通过借鉴深度神经网络这一有力技术和工具来研究新的特征提取方法和目标检测方法，旨在通过探索深度卷积网络内在的多尺度和金字塔层级特性，实现高效的深度网络中特征金字塔的构建，并使得提取出的特征包含更丰富的高层语义信息，同时通过引入视觉注意力模型实现以动作驱动的自顶向下检测方式，充分利用目标周围的上下文信息以达到更加精确的检测。研究成果预期将在理论上推进视觉目标检测识别乃至图像内容理解领域的进一步发展，并将能有效应用于图像、视频内容检索和智能安全监控等领域，为当前大数据和互联网背景下的高效信息检索以及监管提供必要的研究基础。

项目摘要

本项目针对图像和视频中的视觉目标检测与识别这一计算机视觉领域的难点问题，通过借鉴深度神经网络这一有力技术和工具来研究新的特征提取方法和目标检测方法，通过探索深度卷积网络内在的多尺度和金字塔层级特性，以及不同注意力机制的作用和影响，提出了一系列基于注意力机制增强特征学习、基于语义增强的多尺度特征金字塔网络、基于目标模式复杂度与网络结构参数量动态匹配机制等的目标检测方法，充分利用了目标本身语义和模式信息以及其周围的上下文信息，有效提升了目标检测网络（特别是在多尺度、遮挡等困难条件下）的检测性能，并在国际公开标准目标检测数据集上进行了评测验证。本项目的研究成果在理论上进一步推进了视觉目标检测识别乃至图像内容理解领域的发展，也在例如智能安防监控、视频内容检索、车辆自动驾驶、智能交通等众多领域中具有较好的实际应用前景。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.3969/j.issn.1000-4440.2021.03.031

发表时间：2021

DOI：CNKI:SUN:YGXB.0.2018-01-012

发表时间：2018

朱超的其他基金

批准号：31400828

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：81803520

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：71873092

批准年份：2018

资助金额：48.00

项目类别：面上项目

批准号：81300953

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：81202502

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：81700860

批准年份：2017

资助金额：19.00

项目类别：青年科学基金项目

批准号：81870885

批准年份：2018

资助金额：56.00

项目类别：面上项目

批准号：51309112

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：11504046

批准年份：2015

资助金额：24.00

项目类别：青年科学基金项目

相似国自然基金

基于注意力深度网络的SAR目标检测识别一体化方法

批准号：61801098

批准年份：2018

负责人：崔宗勇

学科分类：F0112

资助金额：26.00

项目类别：青年科学基金项目

基于深度信息面向主动视觉任务的视觉目标遮挡检测与规避方法研究

批准号：61379065

批准年份：2013

负责人：张世辉

学科分类：F0210

资助金额：76.00

项目类别：面上项目

基于视觉注意力与手势动作特征建模的自然交互界面优化方法研究

批准号：61902097

批准年份：2019

负责人：楼小龙

学科分类：F0209

资助金额：25.00

项目类别：青年科学基金项目

基于场景分析和视觉注意力的目标搜索

批准号：61075018

批准年份：2010

负责人：胡小鹏

学科分类：F0604

资助金额：10.00

项目类别：面上项目

基于视觉注意力建模与深度特征金字塔网络的目标检测研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于改进LinkNet的寒旱区遥感图像河流识别方法

二维FM系统的同时故障检测与控制

现代优化理论与应用

黄曲霉毒素B1检测与脱毒方法最新研究进展

GF-4序列图像的云自动检测

朱超的其他基金

炎症影响下TLR-2基因修饰对骨髓间充质干细胞的分化调控及其在牙周骨组织再生中的应用

巨噬细胞外泌体在Urocortin保护糖尿病冠脉内皮功能中的作用机制研究

人口学视角下风险态度、全要素生产率与金融资产收益率研究

神经元限制性沉默因子调控μ型阿片受体表达参与髓核免疫炎性反应致神经根性痛的机制研究

基于二维亲水-反相色谱质谱联用的磷脂组学平台应用于II型糖尿病合并冠心病相关的生物标志物的筛查

基于Keap1-Nrf2/ARE信号通路探讨橙皮素防治AMD的作用机制

NRSF介导的μ阿片受体表达调控参与骨癌痛的机制及相关镇痛策略研究

泄水建筑物高含沙水流流量系数试验研究

液体腔透射电镜技术原位研究氧化锌光催化剂的光腐蚀机制

相似国自然基金