支持摘要搜索的数据库多维动态索引技术研究

基本信息

批准号：61502503

项目类别：青年科学基金项目

资助金额：21.00

负责人：魏哲巍

学科分类：

依托单位：中国人民大学

批准年份：2015

结题年份：2018

起止时间：2016-01-01 - 2018-12-31

项目状态：已结题

项目参与者：王仲远,韩家龙,金朵,李雷,江少华

关键词：

数据库索引数据流摘要

结项摘要

As the development of the Internet and the diversification of sources of data collection, processing and analyzing such massive data becomes a central problem of the database community. Current database queries can be broadly classified into two categories: reporting queries and aggregation queries. The former returns the whole data which is accurate, but cannot handle massive data; while the later is efficient yet not expressive enough, as it only returns some simple statistics of the data...In this project, we aim at developing data structure techniques for the summary query problem. A summary query proposes some query constraints, and retrieves a summary for the data that matches the query constraint. To achieve this goal, we plan to focus on the research of merging non-orthogonal summaries, non-self-maintain summary update algorithms and dynamic error parameter supports. We plan to illustrate the efficiency and usefulness of our designs through extensive experiments and a system demonstration.

随着互联网技术的发展和数据收集渠道的多样化,如何处理和分析随之产生的海量数据成为当前数据结构研究中的核心关键问题之一。目前的数据库查询可以大致分为报告查询(reporting query)与聚合查询(aggregation query)。前者精确返回所有符合查询条件的数据，但无法处理海量数据；后者效率较高，但只能返回数据的单个统计量，无法刻画数据分布。.本项目针对以上数据库查询的缺陷，计划研一类支持摘要查询的数据库索引技术。摘要查询是一类新型数据库查询，其目标是在给定查询条件后，高效率地返回关于所有符合条件的数据的一个摘要，用于刻画元数据的分布。本项目针对传统数据库应对海量数据分析的挑战，以实现支持摘要搜索的多维动态数据库索引作为基本目标，通过对非正交范围摘要合并技术、非自维护摘要重建算法以及动态误差参数集成的研究，最终与实际数据库紧密集成并开发支持摘要搜索的数据库原型系统。

项目摘要

针对传统数据库查询的缺陷，项目计划研究一类支持摘要查询的数据库索引技术。摘要查询是一类新型数据库查询，其目标是在给定查询条件后，高效率地返回关于所有符合条件的数据的一个摘要，用于刻画元数据的分布。在课题执行过程中，针对对数据库中近似算法，我们研究了图数据库中各类相似度的近似算法，通过采样等摘要技术，大幅降低了相似度计算的复杂度，为实现百亿规模图上毫秒级相似度查询提供了理论基础。对多维度数据数据，本课题研究了高维度数据以矩阵形式存储时的近似算法，通过矩阵略图等技术，将高维数据转化为低维数据，实现了高精度低延时的转化算法。针对传统多维度索引树对摘要查询的研究，本课题研究了多维度索引树对于均匀独立采样查询与权重独立采样查询的支持。该类查询可进一步用于支持任意摘要查询，是摘要查询基础算法的进一步扩展。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13328/j.cnki.j0s.005141

发表时间：2017

DOI：10. 11772 /j. issn. 1001-9081. 2017. 10. 2760

发表时间：2017

DOI：

发表时间：2016

DOI：10.13229/j.cnki.jdxbgxb20200877

发表时间：2022

DOI：https://doi.org/10.1016/j.cviu.2018.06.003

发表时间：2018

魏哲巍的其他基金

相似国自然基金

支持超平面查询的Web图像数据库索引及主动学习技术研究

批准号：60773077

批准年份：2007

负责人：周向东

学科分类：F0202

资助金额：26.00

项目类别：面上项目

蒙古文搜索引擎技术研究

批准号：61063018

批准年份：2010

负责人：王俊义

学科分类：F0211

资助金额：25.00

项目类别：地区科学基金项目

面向3D XPoint的搜索引擎索引和缓存技术研究

批准号：61872201

批准年份：2018

负责人：刘晓光

学科分类：F0202

资助金额：63.00

项目类别：面上项目

闪存数据库索引与查询优化技术研究

批准号：60873063

批准年份：2008

负责人：崔斌

学科分类：F0202

资助金额：36.00

项目类别：面上项目

支持摘要搜索的数据库多维动态索引技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

新型非易失存储环境下事务型数据管理技术研究

基于负载感知的数据流动态负载均衡策略

A Fast Algorithm for Computing Dominance Classes

Rhombus sketch:自适应和准确的流数据sketch

Ordinal space projection learning via neighbor classes representation

魏哲巍的其他基金

相似国自然基金