流形空间的深度学习模型及多视角人体行为识别方法研究

基本信息

批准号：61772048

项目类别：面上项目

资助金额：63.00

负责人：孙艳丰

学科分类：

依托单位：北京工业大学

批准年份：2017

结题年份：2021

起止时间：2018-01-01 - 2021-12-31

项目状态：已结题

项目参与者：Gao Junbin,石振莲,王博岳,句福娇,姬强,李明洋,胡向杰,郭侃

关键词：

流形学习行为识别深度学习特征融合多视角视频

结项摘要

The changing pattern of action video is very complicated. How to describe this changing pattern, capture the nonlinear structure embedded in video data and learn action video feature, which are research hotpots in action recognition. Oriented the application in human action recognition for multi view video, this project proposes to use manifold to represent the nonlinear structure existing in video data, to establish a deep learning model in manifold space for learning video action feature, and to fuse manifold features of multi view video for human action recognition. In particular, this research focuses on manifold representation for different image and video data, explores the manifold nature, measurement and calculation, establishes deep learning model in manifold space, solves the training problem of deep learning model in manifold space, develops fusion method of different manifold feature, and implements human action recognition based on multiple view video in manifold space. The final goals of this project are to break through the traditional bottleneck of multi-view action recognition, provide theory and technology for deep learning in manifold space, and give a new approach on action recognition technology.

人体行为视频具有复杂的变化模式，如何有效描述这种变化模式，挖掘数据中隐藏的非线性结构，从视频数据中学习行为的表示特征是目前行为识别的研究热点。本项目面向基于多视角视频的行为识别应用，针对行为视频等高维非线性数据，采用流形表示与学习方法分析数据内在的非线性结构，并在流形空间上建立深度学习模型，学习并融合多视角行为的流形特征，实现人体行为识别。重点研究不同图像视频数据的流形表示，探索流形空间的性质、度量和运算，研究和建立流形空间上的深度学习模型，解决流形上深度学习模型的训练问题，发展流形空间不同视角视频特征的融合方法，实现流形上的多视角视频的行为识别。突破传统识别方法在多视角行为视频识别方面的局限性，为流形空间的深度学习模型提供理论与技术支撑，也为多视角行为识别问题提供新的解决方案。

项目摘要

深度学习模型由于其突出的特征表示学习能力而备受关注，大部分已有的深度学习模型都是在欧氏空间进行表示、学习的，现实中的许多数据本质上是处于流形空间的。本项目面向人体行为视频数据，以行为视频数据在流形空间的分析与理解的关键问题为重点，以建立流形上深度学习模型为目标，在研究分析视频数据特点的同时，针对不同类型的行为视频数据，首先提出了视频数据的张量表示，并研究了张量数据的若干降维方法，实现了视频的降维表达；研究了视频数据的多种流形表示方法，以便于根据数据的特点采用不同的流形表示方式；探讨了多视角视频的乘积流形融合表示方法，实现多视角视频的融合；基于深度学习的理论和方法，建立了流形空间的深度学习模型以及流形上模型的优化算法，实现了流形特征深度学习表示。本项目的成果不仅对行为视频的深度学习模型研究具有重要意义，而且能够发展具有一般意义的相关理论方法。.经过四年的努力，已全面完成计划的各项任务。在国际、国内期刊发表(含已录用)论文17篇，其中在国际期刊发表论文16篇（SCI检索16篇），国内期刊发表论文1篇，在本领域主流国际会议上发表论文7篇；培养硕士、博士研究生6名；申请国家发明专利8项，其中授权3项，授权美国发明专利1项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3788/CJL201946.0801003

发表时间：2019

孙艳丰的其他基金

批准号：60973057

批准年份：2009

资助金额：30.00

项目类别：面上项目

批准号：61370119

批准年份：2013

资助金额：73.00

项目类别：面上项目

相似国自然基金

基于小样本深度学习的雷达图像人体行为识别方法

批准号：61901049

批准年份：2019

负责人：何元

学科分类：F0112

资助金额：23.00

项目类别：青年科学基金项目

多视图深度学习的RGBD人体行为识别与理解

批准号：61572431

批准年份：2015

负责人：肖俊

学科分类：F0210

资助金额：64.00

项目类别：面上项目

基于黎曼空间模型的多模态Web图像流形学习及检索研究

批准号：61170093

批准年份：2011

负责人：何儒汉

学科分类：F0211

资助金额：45.00

项目类别：面上项目

基于深度时空层级模型的人体活动识别方法研究

批准号：61671125

批准年份：2016

负责人：程建

学科分类：F0116

资助金额：58.00

项目类别：面上项目

流形空间的深度学习模型及多视角人体行为识别方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于腔内级联变频的0.63μm波段多波长激光器

孙艳丰的其他基金

基于面部视频的疲劳状态分析与理解

RGB-D视频序列特征的深度学习模型及在人体行为识别中的应用

相似国自然基金