面向部分标注多模态数据的大规模跨媒体检索技术研究

基本信息
批准号:61602089
项目类别:青年科学基金项目
资助金额:20.00
负责人:徐行
学科分类:
依托单位:电子科技大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:龙腾,倪志洋,陈杰,武慧敏,王波
关键词:
标签补全多模态数据跨媒体信息检索部分标注
结项摘要

The tremendous explosion of large-scale heterogeneous multi-modal data has significantly increased the demand of more effective cross-media retrieval. Regarding the cross-media retrieval problem on large-scale image-text multi-modal data, existing approaches generally focus on leveraging the available class label information to facilitate the performance of the retrieval model. However, these methods ignore the fact that the quality of the class label information may affect the performance of the retrieval model. . Under such a doomed context, we explore the problem of how to learn effective cross-media retrieval model from existing partially labeled image-text datasets. We will carry out the research from the following three aspects: (1) label completion for partially labeled multimodal data; (2) cross-media retrieval model learning with class label information; (3) modeling nonlinear structure underlying different modalities of data. The above three research points mutually reinforce each other, and they are able to provide both a theoretical basis and practical verification for achieving effective cross-media retrieval model.

大规模的异构多模态媒体数据的爆发式增长,对更高效的跨媒体检索技术提出了迫切的需求。在针对大规模“图像-文本”多模态数据的跨媒体检索问题中,现有的方法通常试图利用已有的类别标签信息提高跨媒体检索模型的性能,却忽视了这些标签信息本身的质量对检索模型性能的影响。. 在此背景下,本课题针对现有的大规模图像文本数据集只包含部分类别标签的局限,探索如何学习出高效的跨媒体检索模型。本项目将从三个方面展开研究:(1)部分标记的多模态数据的标签补全研究;(2)利用标签信息的跨媒体检索模型设计;(3)挖掘各模态数据内部隐含非线性结构。以上三个研究点互为耦合且逐渐增强,为实现高效的跨媒体检索系统提供理论基础支持和实际应用验证。

项目摘要

大规模的异构多模态媒体数据的爆发式增长,对更高效的跨媒体检索技术提出了迫切的需求。在针对大规模“图像-文本”多模态数据的跨媒体检索问题中,现有的方法通常试图利用已有的类别标签信息提高跨媒体检索模型的性能,却忽视了这些标签信息本身的质量对检索模型性能的影响。在此背景下,本项目针对现有的大规模图像文本数据集只包含部分类别标签的局限,探索如何学习出高效的跨媒体检索模型。本项目从三个方面展开研究:(1)部分标记的多模态数据的标签补全研究;(2)利用标签信息的跨媒体检索模型设计;(3)挖掘各模态数据内部隐含非线性结构。并针对三个内容分别设计了(1)基于跨模态数据的协同约束的标签补全算法;(2)基于多模态数据协同约束的共同子空间学习算法和(3)多模态数据的非线性嵌入策略。 对不完备数据条件下的跨媒体检索的数据补全,子空间学习,数据特征融合等方面技术提供了理论和实践探索。基于上述研究成果,发表了17篇学术论文,其中包括SCI期刊论文7篇(中科院JCR分区1区论文1篇,2区论文3篇),国际会议论文10篇(CCF-A类4篇,CCF-B类4篇)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

基于非线性接触刚度的铰接/锁紧结构动力学建模方法

基于非线性接触刚度的铰接/锁紧结构动力学建模方法

DOI:10.19447/j.cnki.11-1773/v.2021.06.005
发表时间:2021

徐行的其他基金

批准号:91428205
批准年份:2014
资助金额:300.00
项目类别:重大研究计划

相似国自然基金

1

面向大数据跨媒体检索的多模态哈希学习方法研究

批准号:61502122
批准年份:2015
负责人:翟德明
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
2

面向检索的大规模多模态数据表示方法研究

批准号:61872428
批准年份:2018
负责人:许信顺
学科分类:F0210
资助金额:64.00
项目类别:面上项目
3

面向大规模多模态媒体信息检索关键技术研究

批准号:61602085
批准年份:2016
负责人:逯波
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
4

面向大规模多媒体检索的异构多模态融合技术研究

批准号:61272290
批准年份:2012
负责人:杨宗桦
学科分类:F0210
资助金额:81.00
项目类别:面上项目