基于结构语义和行为先验的深度视频场景识别模型研究

基本信息
批准号:61702092
项目类别:青年科学基金项目
资助金额:25.00
负责人:郑彩侠
学科分类:
依托单位:东北师范大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:齐妙,王建中,毕超,张科,刘付聪,徐慧,庞宇
关键词:
内容分析结构语义行为先验视频场景识别流形学习与字典学习
结项摘要

Scene recognition is one of the core issues in the field of video analysis and understanding, which has significant application value. However, there are also some remaining problems in scene recognition that need to be solved, firstly, there is a lack of studies on developing effective video scene recognition model; secondly, most existing methods failed in systematically and deeply exploiting the structural semantic information of scene; finally, the importance of human behavior information for scene recognition is ignored. Recent research shows that the exploiting of the structural semantics is a crucial and challenging point in scene recognition, and the scene category is highly relevant to human behavior information. Hence, in order to solve the key scientific problems in video scene recognition, we exploit the structural semantic information of scene from multiple views, and propose a local structural semantics expressing model by using the structured dictionary learning and a deep manifold learning model method with spatial-temporal constraint, moreover, we develop a deep recognition model of video scene from a new perspective, which use the multi-view structural semantics and the behavioral priors to complement the deep learning model for improving the performance of scene recognition model. Through our studies, it is hopefully to provide a novel method and mechanism for the video scene recognition, and add the references and supports for other video understanding tasks.

场景识别是视频分析与理解研究的关键问题之一,具有重要的现实应用价值。但目前仍然存在许多问题亟待解决:大多数场景识别方法都是针对图像提出的,针对视频场景识别的研究较少;场景结构语义信息未被系统、深入的挖掘;人的行为模式信息对场景识别的重要性未被充分重视。近期研究表明:挖掘结构语义是场景识别的关键和挑战;场景语义类别与场景中人的行为模式具有高度相关性。本项目以探索解决视频场景识别中存在的基础和关键科学问题为出发点,从多视角对场景结构语义信息进行挖掘和表达,提出了基于结构化字典学习的局部语义表达模型、基于时-空联合约束的深度流形学习模型;充分挖掘并融合结构语义信息和人的行为模式先验知识,以新的角度构建深度视频场景识别模型,进一步提高现有视频场景识别模型的性能。通过本项目的研究,不仅有望为场景识别探索新的研究思路和机制,并将对视频理解的相关领域提供借鉴与支持。

项目摘要

场景识别是视频分析与处理领域的关键任务之一,对其进行深入研究具有重要的理论研究与现实应用意义。本项目主要深入挖掘场景数据所蕴含的规律和特性,从不同视角给出场景结构语义表达模型,并基于多角度的特征信息、场景中人行为信息实现对视频场景的有效识别,旨在提高场景识别模型的性能和智能化水平。. 在项目执行期间,项目组分别从全局和局部两个角度对场景结构语义表达与特征降维进行研究;基于场景数据的分布和属性,研究基于联合约束机制来自适应构建图,以刻画数据的本质流形结构;从场景语义类别与人的行为模式具有相关性的角度出发,研究视频中人的行为语义识别,以构建场景识别的先验信息,并研究场景多视角语义特征信息的融合机制来构建有效的场景识别模型;分别基于卷积神经网络和字典学习研究有效的主动学习策略,以使得深度和传统浅层识别模型在有标签训练样本较少时均可获得较好的识别性能。基于本项目的研究内容,项目组提出了一系列有效的模型与方法,达到了预期的研究目标,取得了预期的研究成果。. 本项目的研究可为其他相关图像或视频分析与理解领域提供理论基础和技术借鉴。目前,项目组已将本项目的相关方法和技术初步应用于医学影像分析与理解、学生课堂行为分析与理解、监控视频异常事件检测等领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

郑彩侠的其他基金

相似国自然基金

1

基于深度学习的自然图像先验模型及高效视频编码研究

批准号:61872116
批准年份:2018
负责人:赵德斌
学科分类:F0210
资助金额:64.00
项目类别:面上项目
2

基于场景语意理解和深度学习特征表述的视频行为分析研究

批准号:61602014
批准年份:2016
负责人:李楠楠
学科分类:F0210
资助金额:21.00
项目类别:青年科学基金项目
3

联合文本先验和多标注信息的图像深度视觉语义识别方法研究

批准号:61571354
批准年份:2015
负责人:田春娜
学科分类:F0116
资助金额:57.00
项目类别:面上项目
4

视频语义向量空间模型与不良视频识别

批准号:60872142
批准年份:2008
负责人:李弼程
学科分类:F0113
资助金额:25.00
项目类别:面上项目