海量网络视频中的复杂事件检测技术研究

基本信息
批准号:61201387
项目类别:青年科学基金项目
资助金额:26.00
负责人:姜育刚
学科分类:
依托单位:复旦大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:郑莹斌,戴琦,王嫣然,蒋宇东
关键词:
上下文视频事件检测多模态样本采集
结项摘要

This project will focus on an emerging problem in the area of large-scale Internet video analysis. A set of algorithms will be devised for detecting complex Internet video events, including automatic training set collection, multimodality video feature representation, and context-based event learning algorithms. In training set collection, we plan to design a method that uses multiple textual similarity measurements to evaluate the relevancy between an evant and a candidate video. This will be used to filter the noisy web search results and generate a clean set of training samples. In multimodality feature representation, we will use graph-based clustering methods to produce audio-visual joint codebooks, which, compared with using the two modalities separately, can explore deep correlations between them and therefore may be more effective for video event detection. Finally, for the context-based event learning, we plan to model event-concept relationships using a directed graph. Here the concepts refer to lower-level semantic entities such as basic objects and scenes, which are useful cues for event detection in videos. The event-concept relationships will be used in a graph-based formulation that refines initial event detection results, using a formulation that is efficient to solve. The research outcomes of this project will form a good theoretical basis for the topic of video event detection, and will be very beneficial to a large number of important applications such as Internet video retrieval and content management. The proposed methods will also be evaluated in leading video content analysis benchmarks such as the U.S. NIST TRECVID evaluation.

本项目针对当前海量网络视频内容分析这一重大需求,提出一套完整的视频事件检测技术,包括视频事件训练数据的自动采集、多模态视频特征表示和基于上下文分析的事件学习算法。在训练数据采集方面,拟提出一种基于多重文本相似度的度量方法,对网络关键词检索结果进行过滤,进而得到高精度的事件标注;在多模态视频特征表示方面,采用图聚类方式生成视音频联合词袋,深入探索模态间的关联关系;此外,本项目将设计事件检测的上下文分析算法,利用基本概念(如目标、场景)的检测结果提高复杂事件的检测精度。该算法采用有向图来对事件-概念关系建模,以充分发掘事件-概念间的因果及共生关系。本项目的研究成果将为网络视频内容分析奠定一定的理论基础,并为网络视频检索、内容监管等一系列重要应用提供系统化解决思路。研究的成果也将通过国际权威视频分析评测活动检验其性能(如美国国家标准局的视频检索评测TRECVID)。

项目摘要

通过三年的工作,课题组已按计划完成本项目的研究。针对当前海量网络视频内容分析这一关键问题,课题组设计并实现了一套完整的视频事件检测技术,包括建立视频事件类别数据集、多模态视频特征表示和基于上下文分析的事件学习算法。首先,我们建立了一个含有91223个视频共239类的视频事件类别数据集;其次,我们提出一种正则化的深度神经网络以充分利用特征之间的关系,逐步设计并实现了视听双模态特征表示、视觉与动作双模态特征表示以及视频多模态特征的时序表示;与此同时,我们通过使用跨类别的共性模式进行正则化,成功地把上下文关系融入到表示多模态特征的神经网络中。我们所提出的正则化的深度网路在GPU上实现,并在简单的动作识别及复杂的事件识别等数据集上做了大量的测试。通过大量的实验,我们证明所提出的算法优于其他较新的方法。. 另外,为了测试本项目提出的算法是否能快速高效地完成视频复杂事件检测任务,我们参加了MediaEval的暴力事件检测比赛,连续在2013-2015年得到了第一名的成绩,以及2014年IEEE ICME大会上华为举办的手机视频快速标注大赛,得到了“最佳精度奖”。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020
3

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
4

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022
5

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021

姜育刚的其他基金

批准号:61572134
批准年份:2015
资助金额:66.00
项目类别:面上项目

相似国自然基金

1

复杂运动场景视频大数据中异常事件检测研究

批准号:61502042
批准年份:2015
负责人:梁美玉
学科分类:F0210
资助金额:20.00
项目类别:青年科学基金项目
2

基于语义概念深度挖掘的视频复杂事件检测方法研究

批准号:61672268
批准年份:2016
负责人:詹永照
学科分类:F0210
资助金额:63.00
项目类别:面上项目
3

视频异常事件检测中的群体特征感知研究

批准号:61372157
批准年份:2013
负责人:郭春生
学科分类:F0117
资助金额:70.00
项目类别:面上项目
4

面向海量视频库的分布式拷贝检测

批准号:61303159
批准年份:2013
负责人:顾晓光
学科分类:F0210
资助金额:28.00
项目类别:青年科学基金项目