面向大数据跨媒体检索的多模态哈希学习方法研究

基本信息
批准号:61502122
项目类别:青年科学基金项目
资助金额:20.00
负责人:翟德明
学科分类:
依托单位:哈尔滨工业大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:王洋,赵文博,车文斌,王晓虹,芦怡然,倪军,万照麟,马冀
关键词:
哈希学习大规模机器学习跨媒体检索
结项摘要

To confront with the difficulties of high-cost storage and low-efficiency retrieval for large-scale database, hashing based methods have attracted more and more attention and acceptance for people all over the world. The appealing property of hashing methods is they index data with binary hash codes which enjoy not only the compactness of the representation but also the low complexity in distance computation. Based on the recent related work on hashing, this project proposes to research on nonlinear multimodal hash function learning as well as their application in real-world cross media retrieval problems, to deal with the challenges of multimodal, high-dimensionlity, and nonlinear in feature spaces. More specifically, we aim to (1) propose novel nonlinear multimodal hashing approaches by fully use of local information to better modal the complex structure of big data, and analyze and verify their properties; (2) based on the manifold structure of image data and active selection for supervised information, propose semi-supervised multimodal hash learning incorporating with active learning and manifold learning; (3) apply the proposed algorithms to the real-world large scale cross media retrieval systems, in order to improve the query accuracy, recall and efficiency.

为了应对大数据所带来的存储代价大、检索效率低等难题,基于哈希的方法近年来受到了越来越多人的关注和认可。基于哈希的方法最吸引人的特性为将数据表示成二进制的哈希编码来索引,不仅具有更紧致的表示,缩小了存储空间,且采用二进制哈希编码计算复杂度更低。本项目将面向跨媒体检索,在以往相关工作的基础上,针对大数据特征空间所具有的多模态、高维非线性问题,研究新的非线性多模态哈希学习方法以及在具体的应用问题中所需的特定技术。具体研究目标包括:(1) 提出新的非线性多模态哈希学习算法,并利用局部学习,更好的建模大数据的复杂结构,并对算法的各项性能做出分析与证明; (2) 基于图像分布的流形特征和对有监督信息的主动选择,提出融入主动学习、流形学习的半监督多模态哈希学习方法; (3) 所提出的新方法将应用于大数据跨媒体检索系统,以期望提高这些系统的查询精度、召回率和效率。

项目摘要

本课题以多媒体大数据为应用背景,着重研究基于哈希函数学习的离散二值化编码和海明距离计算的核心技术和方法,并兼顾图像处理相关技术在大规模图像视频存储、检索、推荐系统以及视频会议等实际应用问题。在国际顶级期刊上发表研究型长文7篇。在以下几个方面取得了重要研究进展:1) 提出了一种面向大数据多媒体检索的有监督分布式哈希学习技术,该技术在性能损失差别不大的情况下,大大节省了通讯代价、存储代价,节约了时间开销,特别适用于如手机端、客户端、或大数据多终端等场景下的分布式大规模多媒体检索;2) 提出一种新型的参数化局部多视海明距离度量学习方法,更好的建模了大数据的复杂结构,在跨媒体检索中取得了较传统方法更好的性能;3)提出了一种面向大规模推荐系统的离散正则化协同滤波技术。实验结果证明该技术能够进一步提升推荐效率和准确率,在现实的大规模推荐系统中更加有效。4) 提出了一种基于双重稀疏约束的先验模型,针对视频会议中的注视点缺失问题,基于此先验,进一步提出了一种联合注视点纠正与人脸美化的框架。可以有效的纠正视频会议中对话人的视点不相交问题,同时提升对话人的面部美化程度。该技术对在线约会,在线求职等多网络社交活动中具有广泛的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

翟德明的其他基金

相似国自然基金

1

面向网络大数据的跨媒体哈希检索研究

批准号:61872170
批准年份:2018
负责人:姚涛
学科分类:F0211
资助金额:64.00
项目类别:面上项目
2

面向流式大数据检索的增量哈希学习方法研究

批准号:61702394
批准年份:2017
负责人:王笛
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目
3

面向部分标注多模态数据的大规模跨媒体检索技术研究

批准号:61602089
批准年份:2016
负责人:徐行
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
4

面向Web图像检索的在线多模态哈希技术研究

批准号:61702388
批准年份:2017
负责人:谢良
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目