支持摘要搜索的数据库多维动态索引技术研究

基本信息
批准号:61502503
项目类别:青年科学基金项目
资助金额:21.00
负责人:魏哲巍
学科分类:
依托单位:中国人民大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:王仲远,韩家龙,金朵,李雷,江少华
关键词:
数据库索引数据流摘要
结项摘要

As the development of the Internet and the diversification of sources of data collection, processing and analyzing such massive data becomes a central problem of the database community. Current database queries can be broadly classified into two categories: reporting queries and aggregation queries. The former returns the whole data which is accurate, but cannot handle massive data; while the later is efficient yet not expressive enough, as it only returns some simple statistics of the data...In this project, we aim at developing data structure techniques for the summary query problem. A summary query proposes some query constraints, and retrieves a summary for the data that matches the query constraint. To achieve this goal, we plan to focus on the research of merging non-orthogonal summaries, non-self-maintain summary update algorithms and dynamic error parameter supports. We plan to illustrate the efficiency and usefulness of our designs through extensive experiments and a system demonstration.

随着互联网技术的发展和数据收集渠道的多样化,如何处理和分析随之产生的海量数据成为当前数据结构研究中的核心关键问题之一。目前的数据库查询可以大致分为报告查询(reporting query)与聚合查询(aggregation query)。前者精确返回所有符合查询条件的数据,但无法处理海量数据;后者效率较高,但只能返回数据的单个统计量,无法刻画数据分布。.本项目针对以上数据库查询的缺陷,计划研一类支持摘要查询的数据库索引技术。摘要查询是一类新型数据库查询,其目标是在给定查询条件后,高效率地返回关于所有符合条件的数据的一个摘要,用于刻画元数据的分布。本项目针对传统数据库应对海量数据分析的挑战,以实现支持摘要搜索的多维动态数据库索引作为基本目标,通过对非正交范围摘要合并技术、非自维护摘要重建算法以及动态误差参数集成的研究,最终与实际数据库紧密集成并开发支持摘要搜索的数据库原型系统。

项目摘要

针对传统数据库查询的缺陷,项目计划研究一类支持摘要查询的数据库索引技术。摘要查询是一类新型数据库查询,其目标是在给定查询条件后,高效率地返回关于所有符合条件的数据的一个摘要,用于刻画元数据的分布。在课题执行过程中,针对对数据库中近似算法,我们研究了图数据库中各类相似度的近似算法,通过采样等摘要技术,大幅降低了相似度计算的复杂度,为实现百亿规模图上毫秒级相似度查询提供了理论基础。对多维度数据数据,本课题研究了高维度数据以矩阵形式存储时的近似算法,通过矩阵略图等技术,将高维数据转化为低维数据,实现了高精度低延时的转化算法。针对传统多维度索引树对摘要查询的研究,本课题研究了多维度索引树对于均匀独立采样查询与权重独立采样查询的支持。该类查询可进一步用于支持任意摘要查询,是摘要查询基础算法的进一步扩展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

2007-2020中国探月工程VLBI测量数据集

2007-2020中国探月工程VLBI测量数据集

DOI:10.11922/11-6035.csd.2021.0068.zh
发表时间:2022
2

基于时序分区的时态索引与查询

基于时序分区的时态索引与查询

DOI:10.13328/j.cnki.jos.005826
发表时间:2020
3

Ordinal space projection learning via neighbor classes representation

Ordinal space projection learning via neighbor classes representation

DOI:https://doi.org/10.1016/j.cviu.2018.06.003
发表时间:2018
4

推动跨境数据安全有序流动引领数字经济全球化发展

推动跨境数据安全有序流动引领数字经济全球化发展

DOI:10.16418/j.issn.1000-3045.20220802002
发表时间:2022
5

基于纳米铝颗粒改性合成稳定的JP-10基纳米流体燃料

基于纳米铝颗粒改性合成稳定的JP-10基纳米流体燃料

DOI:
发表时间:2021

魏哲巍的其他基金

相似国自然基金

1

支持超平面查询的Web图像数据库索引及主动学习技术研究

批准号:60773077
批准年份:2007
负责人:周向东
学科分类:F0202
资助金额:26.00
项目类别:面上项目
2

蒙古文搜索引擎技术研究

批准号:61063018
批准年份:2010
负责人:王俊义
学科分类:F0211
资助金额:25.00
项目类别:地区科学基金项目
3

面向3D XPoint的搜索引擎索引和缓存技术研究

批准号:61872201
批准年份:2018
负责人:刘晓光
学科分类:F0202
资助金额:63.00
项目类别:面上项目
4

闪存数据库索引与查询优化技术研究

批准号:60873063
批准年份:2008
负责人:崔斌
学科分类:F0202
资助金额:36.00
项目类别:面上项目