基于学习的视频关注计算及其在互动视频技术中的应用

基本信息
批准号:60973055
项目类别:面上项目
资助金额:30.00
负责人:田永鸿
学科分类:
依托单位:北京大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:黄铁军,李甲,李远宁,杨晶晶,牟伦田,杨蓉,刘瑾,贾国琛,康平波
关键词:
视频关注计算WIM多核学习TV互动视频
结项摘要

互动视频正在成为最具吸引力的一个视频技术发展方向,在网络视频、IPTV以及移动视频(即WIM TV)等宽带/无线网络多媒体应用中有广阔的应用前景。本项目将针对WIM TV互动视频技术所面临的共性基础问题,在已有的机器学习和视频分析等相关工作的基础上,研究基于学习的视频关注计算理论与方法。在方法层面,提出并研究自适应多核学习方法,包括自适应多核分类、多核判别聚类和结构化输出多核学习算法,以解决视频关注计算中多个侧面特征空间的组合学习以及多样化的输出结果问题;在模型层面,研究基于学习的视频关注计算模型与方法,特别是融合时域信息来进行底层"显著"特征提取、潜在显著度预测模式的学习、任务驱动的视频关注模式挖掘以及视频片段的关注区域平滑模型。在此基础上,以视频广告自动关联以及视频内容的自适应裁剪为应用背景,开展关键技术研究和实验验证,为新一代WIM TV互动视频服务提供核心算法与技术。

项目摘要

本项目的目标是研究针对互动视频技术的共性基础问题,研究基于学习的视频关注计算理论与方法。项目执行以来,我们按照任务书的规定开展研究,取得了一系列的成果进展,包括:. (1)针对视频关注计算中类内多样、类间混叠与时序相关问题,提出了多项基于局部化和序列化多核学习方法,包括样本特定的多核学习方法PS-MKL、簇敏感的多核学习方法GS-MKL、类共享的多核学习方法CS-MKL以及序列化多概念多核学习方法SVMSML。相关研究成果发表在IEEE TIP、IEEE TMM、EURASIP JIVP等国际期刊和会议。. (2)将机器学习方法引入到视觉显著建模问题上,系统地提出了基于学习的视觉显著计算模型与方法,包括基于概率多任务学习的视觉显著计算方法、基于代价敏感配对排序学习的视觉显著计算方法、基于多任务排序学习的视觉显著计算方法、以及基于Two-Stage模型双眼融合的立体视觉显著计算模型。相关研究成果发表在IJCV、IEEE TCSVT、IEEE SPL(封面文章)等国际期刊和会议。. (3)在感兴趣对象提取、视频内容自适应关联、视频内容自适应裁剪、视频拷贝检测等方面发明了多项应用关键技术,包括基于互补显著度图的感兴趣对象提取方法、面向用户的视频内容自适应关联方法、视频关注区域轨迹的平滑估计方法、基于互补性多检测器级联和时序金字塔匹配的视频近似拷贝检测方法、利用视觉信息实现人体心率和呼吸率监测的方法等。将相关技术应用于中美百万册数字图书馆,获2010年国家科技进步二等奖;2010年和2011年连续两年在视频领域最权威的TRECVID视频副本检测比赛上取得综合成绩第一。相关研究成果发表在IEEE Computer、IEEE Multimedia等国际期刊和会议。. (4)构建了基于区域的视频显著数据集,开发了视频内容自动关联系统SALAD,为进一步研究提供很好的基准数据集与原型实验平台。. 总体来说,本项目累计发表论文25篇,其中国际期刊论文11篇,包括IJCV论文1篇、IEEE TIP/TCSVT/TMM论文3篇、IEEE Computer/ Multimedia论文3篇、IEEE SPL封面文章1篇、EURASIP JIVP等国际期刊论文3篇;获得国家专利授权1项、申请国际PCT专利2项、申请国家专利5项。因此,各项成果指标均已大幅度超过了任务书的规定。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
3

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
4

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021
5

采用深度学习的铣刀磨损状态预测模型

采用深度学习的铣刀磨损状态预测模型

DOI:10.3969/j.issn.1004-132x.2020.17.009
发表时间:2020

田永鸿的其他基金

相似国自然基金

1

噪声流形学习中的矩阵计算方法及其在视频挖掘中的应用

批准号:10901062
批准年份:2009
负责人:王靖
学科分类:A0502
资助金额:17.00
项目类别:青年科学基金项目
2

融合时间空间信息的视频关注分析理论与方法研究及其在手机视频中的应用

批准号:60702035
批准年份:2007
负责人:蒋树强
学科分类:F0113
资助金额:23.00
项目类别:青年科学基金项目
3

视频概念标注方法及其在视频语义检索中的应用

批准号:61073084
批准年份:2010
负责人:彭宇新
学科分类:F0210
资助金额:34.00
项目类别:面上项目
4

基于视觉关注机制的全景视频质量评估研究

批准号:61801364
批准年份:2018
负责人:张伟
学科分类:F0117
资助金额:29.50
项目类别:青年科学基金项目