基于关键词的关系数据库查询技术研究

基本信息
批准号:61303004
项目类别:青年科学基金项目
资助金额:23.00
负责人:林子雨
学科分类:
依托单位:厦门大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:赖永炫,林琛,张东晓,陈婧,赖明星,刘颖杰,叶林宝,曾聪,孙晶
关键词:
关键词查询数据图聚合关系数据库
结项摘要

Keyword search over relational databases has emerged to be a critical problem. It makes it an easier task to retrieve information from structural data, because users, especially casual users, do not need to learn query languages such as SQL or to know anything about data schemas. However, the existing work is not enough on the following three aspects: (a)how to support efficient top-k aggregate keyword search; (b)how to reduce the cost for a single search as much as possible, because the keyword search problem is seen as a minimum Steiner-tree problem in those methods based on data graph, and the minimum Steiner tree problem is proved to be an NP-hard problem; and (c) how to dynamically optimize query results according to the dynamically changing user interest. Therefore, our research work focuses on the following three aspects: (1)providing built-in top-k aggregate keyword search capabilities in RDBMS by a new efficient approach based on aggregate unit cover; (2)proposing a novel keyword search method based on progressive ant colony optimization and data graph, so as to reduce the cost of a single search; and (3)proposing a novel method of dynamic optimization of search results based on concept drift and user interest nodes. A prototype will be developed to carry out the experiments. The academic achievements will include at least ten papers.

采用关键词对关系数据库进行查询,是当前数据库领域的热点研究问题,它不需要用户了解数据库模式知识,也不需要用户掌握专业的结构化查询语言(比如SQL语句),用户只要使用关键词即可查询数据库内容,具有很好的应用前景。目前,对于基于关键词的关系数据库查询问题,学术界在以下三个方面的关键技术研究还不够深入:(a)如何支持高效的top-k聚合关键词查询;(b)如何尽量降低单个查询的代价;(c)如何根据不断变化的用户兴趣动态优化查询结果。本课题将针对上述三个挑战展开相关研究,拟达到以下目标:(1)提出嵌入到RDBMS的、基于聚合单元覆盖的top-k聚合关键词查询方法;(2)提出基于数据图和"渐进"蚁群优化算法的关键词查询方法,有效降低单个查询代价;(3)提出基于概念漂移理论和兴趣节点集的动态查询结果优化方法;(4)将构建原型系统,并发表10篇以上论文。

项目摘要

关系数据库是一种非常成熟的数据存储和管理技术,已经在各个领域得到广泛的应用。针对存在于关系数据库中的结构化数据,可以借助于功能强大的结构化查询语言(比如SQL语句)来查找满足特定要求的记录集合。但是,SQL查询具有一个明显的不足,必须要求用户具有一定的数据库专业知识,能够熟练掌握SQL语句的书写方法,并且需要了解底层的数据库模式信息。很显然,这对于普通用户而言,是一个不小的障碍,因而也就无法灵活地为普通用户提供个性化的查询服务。与此同时,为了适应激烈的市场竞争,企业越来越需要普通员工能够灵活访问企业数据库中的各种数据,提升服务质量和工作效率。因而需要开发面向普通用户的关系数据库数据查询技术。.关键词查询可以很好地解决SQL查询面临的这个问题。关键词查询是互联网中普遍采用的信息检索方式(比如Google和百度),它不需要用户具备任何专业知识,只需要用户提供查找的关键词,系统就可以为用户返回相关的查询结果。受此启发,研究人员开始了采用关键词进行关系数据库的查询的各种探索工作。.本课题对基于关键词的关系数据库查询的关键技术进行了深入研究,主要包括:(a)嵌入到RDBMS的、基于聚合单元覆盖的top-k聚合关键词查询方法,解决了如何高效支持top-k聚合关键词查询问题;(b)基于数据图和“渐进”蚁群优化算法的关键词查询方法,解决了如何有效降低普通关键词查询中的单个查询代价问题;(c)基于概念漂移理论和兴趣节点集的动态查询结果优化方法,解决了如何根据不断变化的用户兴趣动态优化查询结果的问题。本课题研究成果可以广泛应用于企业的信息化平台建设,可以帮助企业把大量的结构化数据以用户友好的方式呈现给使用者(企业员工),极大提高系统的易用性,减少企业在信息化过程中对员工的数据库知识培训开销,同时又能大大提高查询效率。.依托项目资金的支持,本课题共发表学术论文15篇,其中,英文SCI期刊论文4篇,中文EI期刊论文4篇,EI会议论文4篇,北大中文核心期刊2篇,其他论文1篇;同时,以项目为依托,培养了2名博士研究生和7名硕士研究生。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

林子雨的其他基金

相似国自然基金

1

数据库的新型查询技术研究

批准号:61003004
批准年份:2010
负责人:李国良
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目
2

基于查询日志的数据库自动模式匹配技术研究

批准号:61303016
批准年份:2013
负责人:丁国辉
学科分类:F0202
资助金额:26.00
项目类别:青年科学基金项目
3

基于路网时空关键词在线Top-K查询的研究

批准号:61702560
批准年份:2017
负责人:章成源
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目
4

概率数据库查询处理关键技术研究

批准号:61170012
批准年份:2011
负责人:覃飙
学科分类:F0202
资助金额:55.00
项目类别:面上项目