关键字查询作为一种有效查询手段,从XML出现开始就一直是XML数据管理领域重点研究的问题之一。虽然国内外的企业界和学术界投入了大量人力物力进行技术攻关,但基于大规模XML数据的关键字查询技术在查询生成、语义定义、排序机制、查询算法以及结果展示方面依然存在很多问题,这严重制约了XML应用的推广和普及。本课题针对已有方法存在的问题,研究基于大规模XML数据的关键字查询所涉及的一系列尚未解决的关键技术难点,用于处理实际应用中可能遇到的瓶颈问题。包括面向大规模XML数据的实时查询清洗策略、实时查询提示策略、基于基本语义单元和简单谓词的关键字查询语义、基于基本语义单元的可插拔式参数化排序机制、面向大规模XML数据集的高效查询处理算法及动态facet search的理论和方法。该研究是对XML关键字查询技术的全面深化和推进,可填补该领域的多项空白,并在增强XML数据库系统可用性的同时提高其信息利用率。
本项目通过三年的研究工作,圆满完成了计划内容。主要研究成果体现在5个方面:(1)针对现有算法迭代次数多所导致的冗余计算问题,提出了一种基于稳定匹配的算法来提升系统性能;(2)发现了现有查询算法低效的本质原因是公共祖先重复处理和访问无用结点问题,并设计一系列高效索引和基于这些索引并结合集合交集操作的算法;(3)针对现有结果展示方法返回的结果存在冗余和处理低效的问题,提出了一种最紧致匹配子树的概念,并设计了相应的高效算法;(4)针对现有方法只能处理单一语义的问题,提出一系列自顶向下且同时避免公共祖先重复处理和访问无用结点问题的通用算法,可以同时支持多种语义求解;(5)设计并实现了相应的原型系统,并在全国数据库会议和WAIM会议上进行了展示。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
基于事前约束的XML关键字查询处理技术
面向XML数据的关键字查询算法辅助生成技术研究
高扩展性XML关键字查询处理技术
基于近似关键字的大规模空间数据查询与处理