基于深度神经网络的相似性保持哈希的关键技术研究

基本信息
批准号:61772567
项目类别:面上项目
资助金额:64.00
负责人:潘炎
学科分类:
依托单位:中山大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:刘聪,柯戈扬,杜磊,杨尚明,陈纪凯,丁锦棠,耿立冰,陈雅雪,聂照昌
关键词:
哈希方法图片检索卷积神经网络递归神经网络
结项摘要

Similar image retrieval on large-scale databases is a hot research topic in both computer vision and information retrieval communities. Among various approaches for large-scale image retrieval, similarity-preserving hashing is one of the leading approaches. Similarity-preserving hashing methods use random projections or machine learning techniques to construct a set of hash functions. These hash functions can map each of the input samples (e.g., an image) to a binary code, so that similar samples have nearby binary codes but dissimilar samples have binary codes with large distances. This project aims to conduct research on the key techniques for deep-networks-based similarity-preserving hashing methods. (1) We plan to propose novel deep architectures that can convert images/videos to length-limited but similarity-preserving binary codes, where the binary codes can capture the most important content in the input images/videos. (2) We plan to propose learning-based hashing methods by using small set of training samples (e.g. k-shot hashing, hashing based on generative adversarial networks), so as to tackle the cases that are lack of training samples or the cases of cross-domain retrieval. (3) To improve the retrieval efficiency, we plan to propose novel strategies to optimize the procedure of partitioning a long hash code into multiple pieces.

面向海量数据的相似图片检索是计算机视觉、信息检索等领域的热门研究问题。在各种面向大规模图片数据的检索方法中,相似性保持的哈希是主流方法之一。相似性保持的哈希是通过构造随机投影或机器学习等手段得到一组哈希函数,这组哈希函数可以把每个样本(如图片)转换成一定长度的二进制哈希码,并使得相似的两个样本所对应的两个哈希码距离较小,不相似的两个样本对应的两个哈希码距离较大。本课题拟研究基于深度神经网络的相似性保持哈希的关键技术:(1)拟提出合适的深度神经网络结构,可以直接把图片/视频转换成长度受限的二进制哈希码,使得得到的哈希码尽可能地表示复杂图片/视频中的关键信息,并做到“相似性保持”;(2)拟研究基于少量训练数据的哈希模型学习方法(如k-Shot Hashing,基于生成式对抗网络的哈希方法等),以应对训练数据不足或跨领域检索的问题;(3)拟研究对较长哈希码进行分段时的优化方法,以提高检索速度。

项目摘要

本项目研究基于深度神经网络的相似性保持哈希的关键技术,研究内容主要包括(1)提出合适的深度神经网络结构,可以直接把图片转换成长度受限的二进制哈希码,使得得到的哈希码尽可能地表示复杂图片中的关键信息,并做到“相似性保持”;(2)针对细粒度图片检索等场景中每个类别样本较少导致用于训练的三元组数量不足的问题,提出基于知识蒸馏和软标签的三元组构造方法,可以在训练样本较少的情况下构造足够多的三元组,从而提升梯度估计的稳定性,改善生成的哈希码的检索效果;(3)研究对较长哈希码进行分段时的优化方法,以提高检索速度。.本项目已发表(含录用)论文13篇,其中期刊论文10篇(其中IEEE Trans. on Image Processing两篇,为CCF A类期刊;IEEE Trans. on Cybernetics两篇,为中科院JCR一区期刊;IEEE Trans. on Circular Systems and Video Technologies三篇;Information Sciences一篇),国际会议论文3篇(其中CCF B类会议两篇)。本项目申请专利4项(其中1项已获得授权)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
2

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
3

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
4

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

潘炎的其他基金

批准号:61003045
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:61370021
批准年份:2013
资助金额:81.00
项目类别:面上项目

相似国自然基金

1

基于深度神经网络的哈希学习及其在图像检索中的应用研究

批准号:61806110
批准年份:2018
负责人:陈志祥
学科分类:F0604
资助金额:8.00
项目类别:青年科学基金项目
2

基于深度卷积神经网络的对象检测关键技术研究

批准号:61571269
批准年份:2015
负责人:丁贵广
学科分类:F0116
资助金额:66.00
项目类别:面上项目
3

基于深度神经网络的实体关系抽取关键技术研究

批准号:61602059
批准年份:2016
负责人:曾道建
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
4

基于哈希的流式大数据筛选关键技术研究

批准号:61572266
批准年份:2015
负责人:陈华辉
学科分类:F0202
资助金额:66.00
项目类别:面上项目