基于图像属性和深度学习的大规模物体检测研究与应用

基本信息

批准号：61503366

项目类别：青年科学基金项目

资助金额：21.00

负责人：罗平

学科分类：

依托单位：中国科学院深圳先进技术研究院

批准年份：2015

结题年份：2018

起止时间：2016-01-01 - 2018-12-31

项目状态：已结题

项目参与者：杜书泽,邹常青,朱细妹,陈翔

关键词：

模型选择前馈神经网络多层次结构与深度学习网络

结项摘要

Along with the development of modern science and technology, the number of images and videos increase rapidly. How to accurately and efficiently detect human faces, pedestrians, and objects becomes an important topic in the era of big data. Object detection is a fundamental technology which helps extract beneficial knowledge from internet, builds large scale surveillance system, and improves the next generation artificial intelligence such as robotics and drone. However, the conventional object detection methods face with new challenges in the big data era. For example, first, unconstrained and large scale image and video data often have large and complex variants, including crowd, occlusion, low resolution, and viewpoints. Second, the traditional object detection methods often used supervised learning, which needs a large number of annotated data. Nevertheless, data labeling in large dataset costs a lot of resources. Third, efficiency is an important issue in practical applications. To solve the above problems, this project combines attributes and deep learning to jointly model and train different key components of object detection. We are dealing with the following key issues: 1) large scale object detection in complex scenes; 2) weakly- and semi-supervised deep learning; and 3) improvement of the efficiency of deep models. This project adopts deep learning and improves large scale object detection, making it possible to be applied to object detection in real-world applications. In the aspect of algorithm, we will design weakly and semi-supervised deep learning methods and deep model compression. In the aspect of application, we will apply our deep models to large scale face detection, pedestrian detection, and object detection.

随着科技的高速发展，图像与视频数据持续增加并成为主要信息载体。如何准确高效的检测人脸、行人与常见物体已成为大数据时代一个迫切需要解决的问题。物体检测是抽取互联网有用信息、排除劣质信息的技术保障，是构建“平安城市”视频监控网络的基础，是下一代人工智能技术视觉系统如机器人和无人驾驶等的重要组成部分。大规模、非受控复杂图像与视频数据给传统物体检测技术带来巨大挑战。本项目使用图像属性和深度学习对物体检测流程进行统一建模与优化。拟解决的关键问题包括：1）复杂场景的大规模物体检测方法；2）弱监督与半监督深度学习方法；3）深度学习模型的时间效率优化。预期成果：算法方面，完成弱监督与半监督深度学习建模、优化和分析方法。并探索深度网络模型的压缩方法；应用方面，结合算法研究，搭建复杂场景下人脸、行人与常见物体检测流程。本项目的研究对推动物体检测技术在复杂环境下应用有着重要意义。

项目摘要

本项目开展在大规模图像与视频中，如何准确高效的检测人脸、行人与常见物体。这些问题已成为大数据时代一个迫切需要解决的关键问题。它对科技进步与社会发展有着至关重要的作用。本项目以深度学习为基础，为深度学习物体检测、属性识别、模型压缩、模型结构搜索开发新的框架，并以此为核心，研发在物体识别与检测、分割等领域的具体应用。经过全体成员共同努力，取得成果：.1. 深度学习理论研究：利用先进的机器学习理论，为深度学习训练优化和结构搜索过程建立联系。成果发表与ICML 17， IJCAI17，和BigData18等顶级国际会议。.2. 物体检测、属性识别应用研究：构建大规模高影响力的数据集3项，包括CelebA，DeepFashion, WIDER Face。其中CelebA谷歌学术引用超过1000次。三个数据库总共引用超过1500次。.3. 完成CCF-A类论文19篇。其中包括人工智能顶级会议AAAI和IJCAI论文2篇，机器学习顶级会议ICML和NIPS论文2篇，与计算机视觉顶级会议CVPR和ICCV论文9篇。上述成果参加国际会议，并被邀请做口头报告6次。另外，本项目相关工作被邀请投稿至大数据顶级会议IEEE Big Data正式长文论文2篇，并做口头报告。本项目取得具有国际影响力的学术成果，在这一领域继续保持国际领先水平。.4. 申请发明专利3项。.5. 培养研究生4名。..通过本项目科研，.1. 项目期间，项目负责人获得深圳市海外高层次人才（C 类）、深圳市南山区领航人才（C 类）。.2. 在2016年人工智能顶级会议AAAI Conference on Artificial Intelligence，Face Model Compression by Distilling Knowledge from Neurons发表的论文接收为口头报告。接收率小于5%（投稿数大于4000）。.3. 在2017年机器学习顶级会议The Thirty-fourth International Conference on Machine Learning (ICML)发表唯一作者论文Learning Deep Architectures via Generalized Whitened Neural Networks。被邀请做口头报告。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

罗平的其他基金

批准号：61473274

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：81603109

批准年份：2016

资助金额：17.30

项目类别：青年科学基金项目

批准号：31800598

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：19971050

批准年份：1999

资助金额：6.00

项目类别：面上项目

批准号：60973142

批准年份：2009

资助金额：30.00

项目类别：面上项目

批准号：31560277

批准年份：2015

资助金额：39.00

项目类别：地区科学基金项目

相似国自然基金

基于深度学习的复杂图像显著物体检测方法研究

批准号：61473231

批准年份：2014

负责人：韩军伟

学科分类：F0604

资助金额：82.00

项目类别：面上项目

基于深度学习的视觉显著物体检测与跟踪

批准号：61603022

批准年份：2016

负责人：刘铁

学科分类：F0304

资助金额：18.00

项目类别：青年科学基金项目

基于稀疏表示和深度学习的大规模目标检测

批准号：61572472

批准年份：2015

负责人：唐胜

学科分类：F0210

资助金额：66.00

项目类别：面上项目

基于图像集合和深度学习的物体分类关键技术研究

批准号：61662014

批准年份：2016

负责人：徐智

学科分类：F0605

资助金额：33.00

项目类别：地区科学基金项目

基于图像属性和深度学习的大规模物体检测研究与应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

二维FM系统的同时故障检测与控制

罗平的其他基金

分类体系不确定的机器学习研究

LOX-1介导内皮祖细胞功能损伤在高血压发生发展中的作用及机制研究

RhNAC32调控月季单萜醇类花香物质合成的分子基础

多体接触问题的非匹配网格的区域分解算法

基于整数格的短公钥、长私钥指数RSA算法的密码分析

高海拔暴露对工作记忆的影响及其脑机制

相似国自然基金