智能视频监控中基于多模态融合的人体行为识别研究

基本信息
批准号:61871196
项目类别:面上项目
资助金额:63.00
负责人:张洪博
学科分类:
依托单位:华侨大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:杨丽洁,雷庆,陈雁,陈子仪,周以重,杨秀红,蔡微微,张翼翔,袁直敏
关键词:
行为检测智能视频监控多模态融合异常行为监控人体行为识别
结项摘要

Human action recognition is the key technology in the semantic understanding of video content, and is a challenging research topic in computer vision. However, due to the diversity and complexity of human action, occlusion and background cluster, human action recognition in video surveillance system is far away from matured. With development of depth sensor and deep learning, it activated new solution for human action recognition. Researchers need new methods which based on RGB data, depth data and pose estimation, to extract robust feature and understand the semantic of human action. To this end, we puts forward the study of human action recognition in intelligent video surveillance, focus on the representation learning based on multimodal fusion, human-object interaction recognition and spatial-temporal action detection problem. The research on this topic discuss and explore the challenge issues in human action recognition, it can promote the practical application of human action recognition, therefore has important theoretical and practical values.

人体行为识别是视频内容高层语义理解中的关键技术,是计算机视觉中一项充满挑战的研究内容。然而由于监控环境中行为的多样性和复杂性,以及遮挡和背景干扰等因素,使得视频监控系统中的人体行为识别仍有许多问题亟待解决。深度传感器和深度学习的发展,为人体行为识别问题的解决带了新的契机和可行思路,急需形成新的理论和方法,在视频数据,深度数据,姿态感知的基础上,提取鲁棒的人体行为特征,实现对人体行为的语义理解。为此,本课题提出了面向智能视频监控的人体行为识别研究,着重解决人体行为识别中的基于多模态融合的行为表示,人物交互行为识别以及三维时空中的行为检测问题,这些问题既是行为识别理论研究中的难点,也是行为识别在实际应用中的问题,具有重要的理论意义和应用价值。

项目摘要

人体行为识别是视频内容高层语义理解中的关键技术,是计算机视觉乃至人工智能领域中充满挑战的研究内容之一,具有重要的理论研究价值和广泛的应用价值。随着不同传感技术的发展,不同模态的数据给智能视频监控中的人体行为识别的解决带了新的新的契机和可行思路。针对多模态的人体行为识别问题,在视频数据,姿态感知的基础上,本课题提出了面向智能视频监控的人体行为识别研究,着重解决人体行为识别中的基于多模态融合的行为表示,行为识别以及三维时空中的行为检测问题,具体完成以下工作:(1)针对RGB视频中的人体行为识别,提出了基于乱序无关的行为识别模型,以及基于一致性约束的视频级行为识别网络模型训练策略;(2)针对骨架数据中的人体行为识别问题,构建了基于有效骨架拓扑和语义引导的自适应图卷积网络模型、基于短时路径签名的骨架行为识别网络;(3)针对图像中的人物交互行为检测任务,本课题提出了基于姿态注意力和目标语义表示的人物交互行为识别模型,并对最新的基于Transformer架构的交互行为识别模型优化,构建了基于局部关键点和全局Transformer融合的交互行为识别模型;(4)针对视频中人体检测问题,本课题提出了基于提名优化的时序动作定位模型;以及与全局感知与提名关系挖掘的时序动作定位方法。相关的算法在国际主流的重要的公开数据集上取得了较好的性能,并在实际场景取得了一定的应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

张洪博的其他基金

批准号:61502182
批准年份:2015
资助金额:19.00
项目类别:青年科学基金项目

相似国自然基金

1

基于集成流形学习的监控视频中人体行为识别研究

批准号:61462035
批准年份:2014
负责人:罗会兰
学科分类:F0210
资助金额:46.00
项目类别:地区科学基金项目
2

基于多模态特征语义融合的网络不良视频识别

批准号:61103056
批准年份:2011
负责人:左海强
学科分类:F0605
资助金额:21.00
项目类别:青年科学基金项目
3

面向智能视频监控的高度多摄像机信息融合

批准号:60975082
批准年份:2009
负责人:许铭
学科分类:F0304
资助金额:24.00
项目类别:面上项目
4

多模态融合的视频监控数据交互式查询及分析研究

批准号:61772268
批准年份:2017
负责人:张立言
学科分类:F0210
资助金额:62.00
项目类别:面上项目