查询引导的位置敏感哈希

基本信息
批准号:61772563
项目类别:面上项目
资助金额:65.00
负责人:冯剑琳
学科分类:
依托单位:中山大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:Wilfred Ng,王炜,黄强,王桢,邓卓彬,马桂洪
关键词:
查询引导近似最近邻检索随机投影分布式计算位置敏感哈希
结项摘要

Approximate Nearest Neighbor Search is a fundamental problem in processing complex data objects and has extensive applications in various domains, such as database, data mining and computational geometry. Locality-Sensitive Hashing (LSH) and its variants are the most influential solution of the Approximate Nearest Neighbor Search problem in high-dimensional space. Traditionally, an LSH scheme partitions data objects into buckets before any query arrives, and hence a query object and its real neighbor can be partitioned into different buckets. To overcome this limitation, we have newly developed a query-aware LSH scheme named QALSH. In this project, based on our current research progresses, on the one hand we plan to conduct further studies on query-aware LSH from both theoretical and algorithmic perspectives , using the Approximate Nearest Neighbor Search problem as the underlying motivation. On the other hand, we plan to leverage query-aware LSH to solve the Approximate Furthest Neighbor Search and Approximate Closest Pair Search problems, which are closely related to the Approximate Nearest Neighbor Search. In addition, we will study how to effectively implement distributed computing of LSH so that we can easily handle similarity search over massive high-dimensional data. Studies on LSH schemes not only hold great scientific significance in basic theories of computer science, data science and high-dimensional computational geometry, but also enjoy substantial potential in advancing intelligent applications of big data in China.

近似最近邻检索是复杂数据对象处理中的一个基本问题,在数据库、数据挖掘以及高维计算几何等领域有着广泛的应用。位置敏感哈希及其变体是目前最有影响的高维近似最近邻检索机制。传统上,位置敏感哈希在任何查询到来之前已经将数据对象分桶,因此可能将查询对象与它的近邻分进不同的桶。为了克服这一局限,我们新近发展了查询引导的位置敏感哈希机制QALSH。本项目就是希望在我们的现有研究基础上,一方面,针对近似最近邻检索,对查询引导的位置敏感哈希理论与算法开展更深入的研究。另一方面,将查询引导的位置敏感哈希机制用来解决密切相关的近似最远邻检索与近似最近对检索。此外,我们还将研究如何高效地实现位置敏感哈希的分布式计算,以便支持海量高维数据的相似性检索。研究位置敏感哈希技术,不仅在计算机科学,数据科学,高维计算几何等等学科的基础理论方面具有重大科学意义,而且在推动中国大数据智能应用方面具有极其广阔的发展前景。

项目摘要

近似最近邻检索是复杂数据对象处理中的一个基本问题,在数据库、数据挖掘以及高维计算几何等领域有着广泛的应用。位置敏感哈希及其变体是目前最有影响的高维近似最近邻检索机制。传统上,位置敏感哈希在任何查询到来之前已经将数据对象分桶,因此可能将查询对象与它的近邻分进不同的桶。为了克服这一局限,我们新近发展了查询引导的位置敏感哈希机制QALSH: 以查询为锚点动态地进行分桶。本项目在原始QALSH的基础上,一方面,针对近似最近邻检索问题,对查询引导的位置敏感哈希理论与算法开展了更深入的研究。另一方面,将查询引导的位置敏感哈希机制用来解决密切相关的高维相似性检索问题。目前我们在以下方面取得重要研究进展:.1. 将仅仅针对欧式距离(即l2距离)的原始QALSH扩展到解决任意lp距离(0 < p ≤ 2)下的近似最近邻检索问题;.2. 将QALSH用来解决高维欧式空间中的近似最远邻检索问题;.3. 将QALSH用来解决高维欧式空间中的近似最大内积检索问题;.4. 将QALSH与关系数据库系统(PostgreSQL)内核进行耦合;.5. 将QALSH基于非易失性内存进行优化实现;.6. 将QALSH进行单机多核并行化。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

掘进工作面局部通风风筒悬挂位置的数值模拟

掘进工作面局部通风风筒悬挂位置的数值模拟

DOI:
发表时间:2018
2

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

DOI:
发表时间:2020
3

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

DOI:10.6052/1672⁃6553⁃2017⁃059
发表时间:2018
4

敏感性水利工程社会稳定风险演化SD模型

敏感性水利工程社会稳定风险演化SD模型

DOI:10.16265/j.cnki.issn1003-3033.2021.04.003
发表时间:2021
5

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

DOI:10.3901/jme.2020.24.219
发表时间:2020

冯剑琳的其他基金

批准号:60303030
批准年份:2003
资助金额:7.00
项目类别:青年科学基金项目
批准号:60970043
批准年份:2009
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

基于位置敏感哈希的图像语义检索技术研究

批准号:61301232
批准年份:2013
负责人:彭天强
学科分类:F0113
资助金额:24.00
项目类别:青年科学基金项目
2

基于哈希的海量高维数据近似最近邻查询研究

批准号:61472298
批准年份:2014
负责人:崔江涛
学科分类:F0202
资助金额:80.00
项目类别:面上项目
3

LBS中连续查询的位置匿名研究

批准号:60903169
批准年份:2009
负责人:林欣
学科分类:F0205
资助金额:17.00
项目类别:青年科学基金项目
4

检索引导的多模态数据稀疏化降维及哈希技术

批准号:61572298
批准年份:2015
负责人:张化祥
学科分类:F0605
资助金额:67.00
项目类别:面上项目