多模态融合的大规模网络视频名人标注研究

基本信息

批准号：61303175

项目类别：青年科学基金项目

资助金额：23.00

负责人：陈智能

学科分类：

依托单位：中国科学院自动化研究所

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：郑榕,冯柏岚,陈见耸,徐夙,白锦峰,张珊珊,耿旺

关键词：

外部网络资源多模态融合社会特征名人标注网络视频

结项摘要

There are a large number of celebrity videos which receive widespread attention in video sharing websites. However, since the user generated name tags are provided at the whole video level rather than segment or shot level, and are proved to be incomplete and imprecise in many cases, celebrities appearing in web videos are not well annotated. How to develop effective means for large-scale celebrity annotation becomes a timely challenging recently. .Grounded on the related and complementary nature among visual feature, social features and external web resources given a celebrity video, this project aims for the unsupervised and scalable annotation of names in web video celebrity domain from the multi-modality fusion perspective. To this end, we plan to propose a general framework for celebrity annotation in web videos by tagging their faces. Our research will mainly focus on mining social features and external web resources closely related to a specific celebrity video, fusing these features and resources with facial visual feature, as well as developing a multi-modality approach for accurate and scalable annotaiton in web video celebrity domain. Moreover, this project plans to release a large-scale web video celebrity dataset containing thousands of celebrity names and millions of faces detected from web videos, and develop a prototype system for illustrating the performance of web video celebrity annotation. The research results of this project will enrich the theory and applications of web video annotation, and provide practical algorithms and technologies for effective celebrity annotation in web video domain.

包含名人的视频在视频分享网站上受到广泛的关注。然而，由于网络用户提供的人名标签都出现在整个视频层次，且受到人名缺失和错误标注的影响，视频中的名人并没有得到有效的标注。在这种背景下，开展针对大规模网络视频的名人标注研究成为一个充满意义的科学问题。 .本项目将从多模态融合的角度出发，开展无监督和可扩展的大规模网络视频名人标注技术研究。旨在通过挖掘名人视频视觉特征、社会特征和外部网络资源之间的相关性和互补性，提出一个基于人脸标注的网络视频名人标注框架，并对该框架下的关键科学问题展开深入探讨：解决相关社会特征和外部网络资源的有效挖掘问题，以及它们和人脸视觉特征的有效融合问题，探索高精度可扩展的网络视频名人人脸标注方法。此外，本项目还将构建并发布一个大规模网络视频名人及人脸数据库，并开发针对网络视频名人标注的原型系统。本项目研究成果将丰富视频标注的理论和应用，为网络视频名人标注提供核心算法和关键技术。

项目摘要

网络和多媒体技术的快速发展使得越来越多的视频出现在互联网上。名人是这些网络视频最受关注的主题之一。然而，由于网络用户提供的人名标签都出现在整个视频层次，且受到人名缺失和错误标注的影响，视频中的名人并没有得到有效的标注。人们并不能通过这些标签快速找到视频中包含特定名人的片段。在这种背景下，开展针对大规模网络视频的名人标注研究成为一个充满意义的科学问题。 .本项目从多模态融合的角度出发，对无监督和可扩展的大规模网络视频名人标注涉及的各个研究点展开深入研究。主要研究内容包括：1）大规模网络视频名人及人脸数据库的构造和分析：构造了拥有75073个网络视频，总时长超过4000小时的大规模网络视频名人及人脸数据库WebV-Cele。通过统计分析、标注和开展多组基准实验，明确了大规模网络视频名人标注研究的挑战和机遇；2）提出基于图像搜索和匹配的网络视频名人标注方法：该方法首先用视频周边文本中的人名作为查询，通过图像搜索引擎收集该人物的典型网络图像，然后计算视频中人脸与所收集网络人物图像的相似度，基于比对结果实现对视频中人物的标注。该方法具有无监督和扩展性好的特点；3）交互式网络视频名人标注方法与系统：研究了多线索融合的网络视频名人交互式标注方法与系统，通过挖掘和显示多种与标注相关的线索，更好的辅助人工标注。真实网络视频上的名人标注实验表明，该方法可以显著提高网络视频中名人标注的效率；4）大规模网络视频索引、理解和超链接：基于标签的多属性分析和挖掘，提出了一种热门网络视频与网络上关于该视频相关报道的自动超链接的方法。研究了基于二进制编码的大规模网络视频索引和搜索方法，提高了大规模视觉搜索的精度和效率。基于深度学习，研究了视频字幕的自动检测和识别问题，提出了多种解决方案。.本项目的研究产生了多篇高水平论文和专利，研究成果丰富了视频标注的理论和应用，为网络视频名人标注提供核心算法和关键技术。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

陈智能的其他基金

批准号：61772526

批准年份：2017

资助金额：62.00

项目类别：面上项目

相似国自然基金

基于多模态特征语义融合的网络不良视频识别

批准号：61103056

批准年份：2011

负责人：左海强

学科分类：F0605

资助金额：21.00

项目类别：青年科学基金项目

基于多模态融合的互联网图像中人物行为标注研究

批准号：61772319

批准年份：2017

负责人：李晋江

学科分类：F0207

资助金额：69.00

项目类别：面上项目

基于多模态融合机制的视频语义表征方法研究

批准号：61702313

批准年份：2017

负责人：侯素娟

学科分类：F0210

资助金额：25.00

项目类别：青年科学基金项目

面向部分标注多模态数据的大规模跨媒体检索技术研究

批准号：61602089

批准年份：2016

负责人：徐行

学科分类：F0211

资助金额：20.00

项目类别：青年科学基金项目

多模态融合的大规模网络视频名人标注研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于腔内级联变频的0.63μm波段多波长激光器

陈智能的其他基金

真实水下环境中的大规模珊瑚礁鱼类检测与识别

相似国自然基金