视频大数据全效处理体系关键技术及应用研究

基本信息
批准号:61772114
项目类别:面上项目
资助金额:64.00
负责人:董乐
学科分类:
依托单位:电子科技大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:高建彬,徐行,张宁,封宁,陈修远,孔改捧,董文普,毛梦蝶,徐梽桐
关键词:
全效处理弱监督学习VADORE框架视频大数据深度增强学习
结项摘要

This research intends to establish a video-adaptive holons representation framework, namely V-ADORE. This framework enhances the training efficiency and the ultimate performance of the network via data-driven and prior knowledge based on an information reinforcement policy; builds a weakly-supervised analysis model to conduct consistency constraints for video content and semantic labels; builds a video description model based on the integrated attention mechanism for video applications, the model can improve the description accuracy via adaptive weights of different frames, and designs the stable transfer mechanism of the information to achieve information sharing between different video tasks effectively. This research intends to concentrate on the key contents such as “information reinforcement policy”, “weakly-supervised analysis network”, “video description and annotation models”, “information transfer and sharing mechanism” etc. This research mainly focuses on flexible and reliable models and algorithms of the video-oriented applications. From the perspective of effectiveness, this research overcomes the limitations such as lack of training labels, poor transplant universality, and low processing efficiency of traditional video applications, and provides the balance validation of video-adaptive in complex environment on computation complexity and accuracy.

本课题拟建立一个视频大数据全效处理体系框架,我们将其命名为V-ADORE(Video-Adaptive Holons Representation)。该框架通过信息增强策略,以融合数据驱动和先验指导的方式提升网络训练效率与最终性能;建立弱监督分析模型,对视频内容与标签语义进行一致性约束,缓解标签噪声问题;建立融合注意力机制的视频描述模型,提取视频各帧图像关键信息,提高自然语言描述准确性;设计稳定的信息迁移规则,建立视频内容与描述句子语义间的联系,实现不同视频任务间信息的高效共享。课题拟围绕“信息增强策略”、“弱监督分析模型”、“视频描述与标注应用模型”、“视频任务迁移及共享机制”等核心内容,主要研究灵活可靠的视频应用模型与算法,从实效的角度克服传统视频应用训练标签缺失、移植普适性差、处理实时性低的问题,为视频大数据提供在复杂环境下计算复杂度和精准度的平衡性验证。

项目摘要

本项目建立了一个视频大数据全效处理体系框架,其被命名为V-ADORE(Video-Adaptive Holons Representation)。该框架通过信息增强策略,以融合数据驱动和先验指导的方式提升网络训练效率与最终性能;建立弱监督分析模型,对视频内容与标签语义进行一致性约束,缓解标签噪声问题;建立融合注意力机制的视频描述模型,提取视频各帧图像关键信息,提高自然语言描述准确性;设计稳定的信息迁移规则,建立视频内容与描述句子语义间的联系,实现不同视频任务间信息的高效共享。.通过对视频大数据全效处理技术的研究,深入挖掘和探索视频应用的高效能全效表达,建立了一套以融合数据驱动策略与先验知识指导为信息增强策略的弱监督学习框架,设计了一个基于深度增强学习的视频描述与标注应用模型。弥补了传统视频应用训练标签缺失、移植普适性差、处理实时性低的缺陷,解决了视频大数据来源分散、结构缺失、信息冗余的问题,为视频大数据全效处理体系及应用研究提供全新理论与可行实践基础。.对于复杂环境不确定性的挖掘(数据驱动),建立视频大数据在多维度上的隐含信息挖掘机制。研究搭建将先验指导与数据驱动有机融合于网络中的信息增强策略。提出了一种用于单图像去雨的非局部增强编码器解码器网络,受自适应非局部均值滤波器的启发,将非局部操作纳入该网络端到端网络框架的设计中。.对于挖掘视频大数据的深层语义特征,研究视频大数据的弱监督分析模型及任务迁移规则,研究适用于视频大数据的弱监督学习模型,为视频大数据的标签增强及关键信息获取提供支撑。提出了一种基于策略的多区域注意力模型用于自动视频描述。通过压缩向量来表示视频的动态信息,最后,通过长短时记忆网络的变体接受这个压缩向量并输出一个可变长度的句子。在多个领域权威数据集上均取得优异表现。.对待检测样本缺少标签和清晰数据的视频数据构建自动标注与表达共享机制的研究。提出了一个称为紧密无监督网络的紧凑型网络来解决图像分类问题。与通常的卷积神经网络学习方法相比,该网络的学习是通过K-means方法在不同的图像块上实现的。适用于几乎没有任何标记的训练图像上,大大降低了计算成本,同时保持了高辨别力,此方法在稀疏标签和模糊样本图像感知问题上具有很大意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018

董乐的其他基金

批准号:61003123
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:61402154
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:61370149
批准年份:2013
资助金额:76.00
项目类别:面上项目

相似国自然基金

1

视觉大数据全效处理体系关键技术研究

批准号:61370149
批准年份:2013
负责人:董乐
学科分类:F0210
资助金额:76.00
项目类别:面上项目
2

大尺度时空视频数据表达及巡航无人机视频高效编码技术

批准号:61671336
批准年份:2016
负责人:胡瑞敏
学科分类:F0108
资助金额:66.00
项目类别:面上项目
3

机载大孔径静态干涉光谱成像数据处理关键技术研究

批准号:61405203
批准年份:2014
负责人:景娟娟
学科分类:F0501
资助金额:25.00
项目类别:青年科学基金项目
4

物联网环境下视频大数据处理平台设计理论与关键技术研究

批准号:61300013
批准年份:2013
负责人:张海涛
学科分类:F0204
资助金额:25.00
项目类别:青年科学基金项目