面向检索的大规模多模态数据表示方法研究

基本信息

批准号：61872428

项目类别：面上项目

资助金额：64.00

负责人：许信顺

学科分类：

依托单位：山东大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：甘甜,罗昕,王永欣,陈振铎,李传祥,肖博文,于万金,尹晓雅,吴烨

关键词：

哈希学习多模态监督学习多媒体检索

结项摘要

Large-scale multimoal data are avaible in various areas. To manage and organize such data, people usually need to efficiently search the data. Therefore, how to represent the multimodal data becomes an important and key problem to improve the search efficiency and accuracy. Recently, hashing technique has attracted more and more attention, which is able to transform the data into short binary codes while preserving the similarity of the data. However, there are still some challenges when existing hashing methods are applied to the large-scale multi-modal data. To address these challenges, this project aims to propose efficient and effective hashing schemes for the binary representation of large-scale multmodal data. The contents include: (1) Proposing an efficient and easy-to-be-optimized descrete hashing method and building the theoretical basic for it; (2) proposing a hashing scheme which can make full use of multiple supervised information; (3) proposing a hashing method with low memory space requirement and fast optimization speed; (4) proposing an effective scheme to fuse deep learning and traditional hashing techniques for multimodal data. In general, the project will provide new and efficient schemes and directions for large-scale multimodal data represenation and hashing techniques.

目前，各个行业中多模态数据大量存在。在对这些多模态数据进行组织和管理中，往往需要对其进行快速检索。为此，多模态数据的有效表示无疑成为提高检索效率和精度的重要因素。近几年能够对数据进行二进制表示并保持相似性的哈希技术引起越来越多研究者的关注。但是，目前的哈希技术针对大规模多模态数据时仍然存在许多挑战。针对大规模多模态数据的二进制表示问题以及目前哈希技术存在的问题，结合监督学习理论本项目将开展的研究内容包括：(1) 提出易于优化的高效离散哈希方法和理论；(2) 提出能够有效利用多模态多种监督信息的哈希方法；(3) 提出一种能够降低内存消耗提高优化效率的哈希学习方法；(4) 提出针对多模态数据能够对深度学习和传统哈希技术进行有效融合的方案，并构建其理论基础。本项目将为大规模多模态数据二进制表示提供基于哈希技术的新的更为高效实用的解决思路和方向，研究成果将丰富多模态数据表示、哈希学习等领域的理论和

项目摘要

目前，各个行业中多模态数据大量存在。在对这些多模态数据进行组织和管理中，往往需要根据给出的查询样本对数据库进行快速检索。为此，多模态数据的有效表示无疑成为提高检索效率和精度的重要因素。近几年能够对数据进行二进制表示并保持相似性的哈希技术引起越来越多研究者的关注。但是，目前的哈希技术针对大规模多模态数据时仍然存在许多挑战。针对大规模多模态数据的二进制表示问题以及目前哈希技术存在的问题，结合监督学习理论本项目开展的研究内容包括：(1) 提出易于优化的高效离散哈希方法和理论，所提出的离散优化方法能够避免因为离散变量的松弛而引起的量化误差问题，从而提高模型的性能；(2) 提出能够有效利用多模态多种监督信息的哈希方法，所提出的方法可以充分利用标签所包含的信息，比如标签之间的结构信息，同时也能够充分利用数据结构信息，通过多种信息的充分利用，可以有效提高模型的性能；(3) 提出能够降低内存消耗提高优化效率的哈希学习方法，所提出的方法避免使用样本对相似性矩阵，从而将空间复杂度有效降低，同时时间复杂度保持线性；(4) 提出针对多模态数据能够对深度学习和传统哈希技术进行有效融合的方案，提出了基于深度的特征表示方法，同时结合传统学习方法学习数据的二进制表示。以上所提出的方法为相关领域的离散优化问题提供了可以参考的解决方案，为多媒体快速检索任务提供了有效解决方案，为相关领域的研究和行业应用提供借鉴。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.7641/CTA.2018.70969

发表时间：2018

许信顺的其他基金

批准号：61173068

批准年份：2011

资助金额：58.00

项目类别：面上项目

批准号：61573212

批准年份：2015

资助金额：16.00

项目类别：面上项目

相似国自然基金

面向部分标注多模态数据的大规模跨媒体检索技术研究

批准号：61602089

批准年份：2016

负责人：徐行

学科分类：F0211

资助金额：20.00

项目类别：青年科学基金项目

面向大规模多模态媒体信息检索关键技术研究

批准号：61602085

批准年份：2016

负责人：逯波

学科分类：F0202

资助金额：20.00

项目类别：青年科学基金项目

面向大数据跨媒体检索的多模态哈希学习方法研究

批准号：61502122

批准年份：2015

负责人：翟德明

学科分类：F0605

资助金额：20.00

项目类别：青年科学基金项目

面向大规模多媒体检索的异构多模态融合技术研究

批准号：61272290

批准年份：2012

负责人：杨宗桦

学科分类：F0210

资助金额：81.00

项目类别：面上项目

面向检索的大规模多模态数据表示方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

具有随机多跳时变时延的多航天器协同编队姿态一致性

许信顺的其他基金

基于机器学习的多义性数据概念标注研究

面向复杂数据的哈希学习方法研究

相似国自然基金