云数据库查询模式集自动生成与检索关键技术研究

基本信息
批准号:61170184
项目类别:面上项目
资助金额:55.00
负责人:袁晓洁
学科分类:
依托单位:南开大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:卫金茂,温延龙,徐雷,张海威,张莹,廉鑫,胡翔宇,张路
关键词:
模式图查询模式关键字检索检索日志
结项摘要

随着云计算与数据库的广泛应用,越来越多的普通用户迫切希望直接访问云端海量带有结构信息的数据。然而,现有云数据库的查询方式,制约了普通用户的需求。如何使普通用户可以便捷、高效检索云数据库,已成为国内外学术界与企业的研究热点。本课题采用数据库与信息检索相结合的方法,研究如何利用云数据库模式,实现普通用户快速、准确检索云数据库的新方法:拟采用模式图描述云数据库模式,研究云数据库的模式图抽取方法,设计模式图节点查询意向度算法;提出基于模式图的候选查询模式集自动生成方案;研究用户通过关键字检索意向查询模式的方法;分析检索日志,改进查询意向度的计算与查询模式集的生成与检索过程。本课题主要攻克云数据库模式抽取、查询模式集自动生成和查询模式集检索排序等目前尚未解决的科学问题。本课题研究内容符合数据库领域最新研究趋势,有望取得有一定影响力的成果,在云数据库关键字检索领域打开新的研究视野。

项目摘要

随着云计算与数据库的广泛应用,越来越多的普通用户迫切希望直接访问云端海量带有结构信息的数据。然而,现有云数据库的查询方式单一、学习难度高,严重制约了普通用户对云端数据的访问。如何使普通用户可以便捷、高效检索云数据库,已成为国内外学术界与企业共同的研究热点。.本课题采用数据库与信息检索相结合的方法,借鉴搜索引擎成功经验,研究如何利用云数据库模式,实现普通用户快速、准确检索云数据库的新方法:采用模式图描述云数据库模式,研究云数据库的模式图抽取方法,设计模式图节点查询意向度算法;提出模式摘要和重叠模式摘要算法;提出基于模式图的候选查询模式集自动生成方案;研究用户通过关键字检索意向查询模式的方法;分析检索日志,改进查询意向度的计算与查询模式集的生成与检索过程。.本课题的研究主要攻克了云数据库模式抽取、模式摘要、查询模式集自动生成和查询模式集检索排序等科学问题,主要取得了以下研究成果:.提出了基于MapReduce的分布式主键发现算法和基于最近邻搜索的外键识别算法,实现了云数据库模式抽取,算法具有良好的性能和扩展性,为充分理解云数据库模式、构建云数据库模式图提供依据,解决了云数据库无法提供聚集、连接等查询的关键问题。.提出了一种模式图中实体、属性、实体集合的查询意向度计算方法,该方法能够作为候选查询模式计算的理论依据,同时可对复杂模式数据库模式摘要形成与数据集成提供有力指导,在此基础上提出一种新的模式摘要生成方法,并首次提出重叠模式摘要及其生成方法。.提出了关系数据库动态表单查询方法,以数据库模式图和查询意向度计算结果为基础,分析用户的反馈信息,动态地生成满足用户偏好查询表单,为用户提供更快更准确的数据库检索服务,更易满足用户需求。.提出了一种基于MapReduce的表单检索方案,该方案融合了关键字检索和表单查询技术,使用用户输入的关键字检索预先生成的查询表单,既缩小了候选表单集合的范围,又有助于准确表达用户的查询意图。该方案支持智能手机、平板电脑等移动智能终端访问,用户可随时随地访问云端数据库。.本课题的研究内容符合数据库与信息检索领域最新研究趋势,课题组的研究成果为云数据库的数据质量管理,云数据库易用性和异构数据查询提供了新的解决方案和思路;同时,也为其他学科访问和分析异构数据集提供了解决方案。本课题的研究成果将有力推动数据库及其相关学科的研究与发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020
2

基于直观图的三支概念获取及属性特征分析

基于直观图的三支概念获取及属性特征分析

DOI:10.3778/j.issn.1673-9418.2104120
发表时间:
3

基于物联码的工业产品信息追溯方法研究

基于物联码的工业产品信息追溯方法研究

DOI:10.19287/j.cnki.1005-2402.2019.09.028
发表时间:2019
4

高功率掺镱光纤激光振荡器研究进展

高功率掺镱光纤激光振荡器研究进展

DOI:10.3788/LOP55.120006
发表时间:2018
5

新型非易失存储环境下事务型数据管理技术研究

新型非易失存储环境下事务型数据管理技术研究

DOI:10.13328/j.cnki.j0s.005141
发表时间:2017

袁晓洁的其他基金

批准号:61772289
批准年份:2017
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

基于查询日志的数据库自动模式匹配技术研究

批准号:61303016
批准年份:2013
负责人:丁国辉
学科分类:F0202
资助金额:26.00
项目类别:青年科学基金项目
2

云环境中密文数据库可验证更新与检索技术研究

批准号:61902315
批准年份:2019
负责人:苗美霞
学科分类:F0205
资助金额:28.00
项目类别:青年科学基金项目
3

概率数据库查询处理关键技术研究

批准号:61170012
批准年份:2011
负责人:覃飙
学科分类:F0202
资助金额:55.00
项目类别:面上项目
4

高精度的跨语言信息检索查询词自动翻译技术研究

批准号:60970057
批准年份:2009
负责人:姚建民
学科分类:F0211
资助金额:31.00
项目类别:面上项目