基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

基本信息

批准号：61463032

项目类别：地区科学基金项目

资助金额：44.00

负责人：李菁

学科分类：

依托单位：南昌大学

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：曾明如,黄伟,段雯亭,余运俊,赖蘋华,余晖,康利平,谌新

关键词：

特征提取场景理解机器人视觉深度学习计算机视觉

结项摘要

How to help the robots better understand their working environments is one of the most challenging worldwide research topics. For the mobile robot systems in complex scenes, the robots are assumed to have similar cognition ability as human beings. However, existing vision sensor-based scene understanding entails the following challenges: 1) The collection of image databases: how to avoid that the pictures captured by the robots contain no objects? 2) Feature representation and learning: scene understanding is a high-lever vision task with low-level vision as its basis. In feature representation, how to effectively fuse the features from different sources in order to describe the objects accurately and reduce the burden of manually designed features? 3) Dimensionality reduction: robots frequently find it difficult to recognize objects and successfully complete assigned tasks in challenging scenarios, e.g., scenes with a significant amount of clutter. How can we obtain more robust features and help the robots understand scenes in real-time? Based on computer vision techniques, this project aims to construct a deep learning-based scene understanding system by: i) collecting and analyzing the images taken from Omni-directional vision sensor and Microsoft Kinect; ii) extracting the biological-inspired gist features and saliency features and conducting deep learning to learn effective fused features; and iii) designing a new manifold learning algorithm to reduce the dimensionality of feature vectors to achieve the adaptability and real-time performance in scene understanding. The system improves the ability of robots by fully utilizing the information encoded in visual inputs for scene understanding. It achieves the effectiveness, self-adaption, real-time performance, and is hence helpful for the widespread deployment of navigation systems in robot vision.

如何使机器人更好地理解其所在工作环境，是长久以来国内外学者密切关注并积极探讨的具有挑战性的研究课题之一。对于工作在复杂场景中的移动机器人系统，具有与人类相类似的环境认知能力是其能够自主运行的前提条件。然而，基于视觉传感器的场景理解常面临如下难点：1）图像的采集：如何避免机器人获取的图像中不包含目标物体？2）目标的特征表达和学习：场景理解作为高层视觉任务，其基础是底层视觉。如何有效融合多源特征对目标进行准确描述并减少人工设计特征的工作量？3）特征降维：如何获得更鲁棒的特征，使机器人能够实时理解环境？本项目从计算机视觉出发，拟建立一个基于深度学习的上下镜理解系统。通过采集及分析全方位视觉传感器和Kinect获取的图像，结合生物启发性的特征提取，用深度学习的方法进行特征学习，并设计一种新型流形学习方法对特征进行降维，实现场景理解的自适应性和实时性，为机器人视觉导航系统提供重要的技术支撑。

项目摘要

本项目着重研究了基于特征提取和融合的复杂场景中一系列重要的关键科学技术问题。首先，本项目研究了视觉跟踪中前景目标物体的检测问题。在传统的帧间差分和三帧差分前景分割方法中，大多数算法都会出现鬼影或者空洞，分割效果不尽如人意。为此，本项目提出一种改进的三帧差分算法和一种结合背景减除和帧间差分法的前景检测方法，还首次将经典的感知哈希应用于运动目标跟踪。并进一步提出两种改进的感知哈希算法，妥善地解决了场景理解实时性的难点。其次，本项目提出一个遗留物快速检测与识别的方法，融合了基于双向背景建模、均值漂移跟踪、基于像素区域信息的前景检测等算法。分析了在具有噪声和遮挡的复杂场景中，遗留物与像素级行人之间的关系，再通过结合矩不变和主成分分析来识别摄像机从不同方向和位置观察到的遗留物品。再次，本项目研究了基于多源数据融合的手势识别方法。区别于传统的彩色图像手势识别，本项目有效地融合了彩色信息，深度信息，和骨骼信息，通过特征提取和融合对手势进行准确分割。并构造双通道的卷积神经网络以减少人工设计特征的工作量，通过统计实验验证的手段证明了新方法较传统方法在手势识别中的优越性，有助于提高手势识别在人机交互中的有效性和实时性。此外，本项目还创建了若干个图像和视频数据库。研究团队在本项目相关研究领域中已接收和发表了一系列高水平的国际期刊和会议论文，完成了项目申请书中规定的所有研究内容。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

DOI：

发表时间：2017

DOI：10.12305/j.issn.1001-506x.2022.03.19

发表时间：2022

李菁的其他基金

批准号：39970082

批准年份：1999

资助金额：11.00

项目类别：面上项目

批准号：30470181

批准年份：2004

资助金额：20.00

项目类别：面上项目

批准号：71103068

批准年份：2011

资助金额：21.00

项目类别：青年科学基金项目

批准号：31101436

批准年份：2011

资助金额：10.00

项目类别：青年科学基金项目

批准号：61703198

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：31260081

批准年份：2012

资助金额：48.00

项目类别：地区科学基金项目

批准号：81401333

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：31370505

批准年份：2013

资助金额：86.00

项目类别：面上项目

批准号：31200874

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

融合先验建模和深度学习的自然场景视觉理解研究

批准号：61672273

批准年份：2016

负责人：路通

学科分类：F0209

资助金额：59.00

项目类别：面上项目

基于结构化深度学习的场景理解

批准号：61872364

批准年份：2018

负责人：卢汉清

学科分类：F0210

资助金额：63.00

项目类别：面上项目

基于深度学习的装配场景理解及装配诱导、监测研究

批准号：51475251

批准年份：2014

负责人：陈成军

学科分类：E0510

资助金额：80.00

项目类别：面上项目

基于场景语意理解和深度学习特征表述的视频行为分析研究

批准号：61602014

批准年份：2016

负责人：李楠楠

学科分类：F0210

资助金额：21.00

项目类别：青年科学基金项目

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

新型树启发式搜索算法的机器人路径规划

现代优化理论与应用

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

基于小波高阶统计量的数字图像来源取证方法

空中交通延误预测研究综述

李菁的其他基金

中国濒危苔类植物囊绒苔属的保护生物学研究

东亚特有濒危植物尖叶拟船叶藓种群生存力分析的研究

非平等交易下农村集体土地自演化产权与强制性产权冲突、磨合机理研究

亚洲玉米螟性信息素受体基因克隆、表达及功能研究

基于行为识别和意图估计的孤独症早期诊疗辅助系统

武陵山区蛇足石杉遗传多样性与石杉碱甲含量相关性研究

Toll样受体-4及其拮抗剂在类风湿关节炎发病机制和治疗中的作用

我国不同人群肠道菌群组成结构的宏基因组研究及其影响因素和机制

分泌型miR-29家族在肝脏胰岛素抵抗发生过程中作用的研究

相似国自然基金