不确定XML数据查询处理关键技术研究

基本信息
批准号:61202083
项目类别:青年科学基金项目
资助金额:23.00
负责人:宁博
学科分类:
依托单位:大连海事大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:林国顺,刘宁,肖智博,牛盼盼,李新龙,张广,闫振丰
关键词:
不确定数据概率XML查询处理
结项摘要

With the wild application of sensor network and RFID, more and more uncertain data need to be managed and applied. The XML which is a kind of semi-structured data naturally express the uncertainty of uncertain data, therefore uncertain XML database has become the hot topic in database research area. The query processing is the core part of uncertain XML data management. Uncertain XML database is based on the traditional XML database technology, while the addition information is the probabilistic values. The new problem brought by probabilistic values can not be solved by traditional techniques, including storage, index and query processing. Therefore it is a new challenge. With the development of new applications, the researches on uncertain XML data need to be done eagerly. In this project, we study the key techniques of query processing on probabilistic XML data, and we propose new data model for general cases, and design the encoding and storage schemes. To solve the complicated query types, we design the query algorithms and build the index to increase the efficiency. We believe that our project can solve the problems of query processing in uncertain XML database. Also we can apply more uncertain data in the practical applications. The project has values of both theory and practical applications.

随着传感器网络、RFID等感知技术的应用推广,越来越多的不确定性数据需要被管理和应用,而半结构化数据XML能够很好的对不确定性数据进行表达,因此不确定XML数据库成为数据库领域的热点研究问题。查询处理技术是不确定XML数据管理的核心。不确定XML数据库在传统半结构化数据库的基础上引入了概率来表达不确定性,传统技术不能很好的解决概率带来的新问题,大量的概率信息为数据存储、索引建立和查询处理提出了新的问题和挑战。在新的应用不断发展的背景下,不确定XML数据的复杂查询处理有待进一步深入研究。本项目将研究概率XML数据查询处理的关键技术,提出适应于新应用的通用不确定XML数据模型,设计概率XML文档的编码和存储策略,针对几种复杂查询类型,设计实现查询算法,并构建索引提高查询效率。本项目能解决不确定XML数据的查询处理问题,进一步拓宽不确定数据的实际应用,具有重要的理论意义与实际应用价值。

项目摘要

本项目的执行时间是2013.1——2015.12,这期间项目主要研究了概率XML查询处理技术的各个方面,现总结如下:.1. 在概率XML数据模型和文档编码方面,项目组提出了基于前缀的PEDewey编码策略,既考虑了文档结构又考虑了文档中的概率。.2. 在概率XML数据查询处理方面,项目组提出了概率XML文档上的twig查询处理;在概率XML文档上的Top-k查询处理方面,提出了两种解决方案,分别是基于概率约束优先策略的Top-k概率查询处理和基于混合策略的Top-k概率查询处理方法。.3. 在概率XML数据上的布尔型查询方面,项目组提出了支持反向轴的XPath表达式文档过滤方法,该方法中提出了PXPE-树索引结构、支持反向轴表达式的过滤算法;项目组提出了基于阈值查询的概率XML文档过滤算法,该方法中提出了PXTrie查询分解、PXTrie索引、以及支持阈值查询的概率XML文档过滤算法。.4. 在概率XML文档的关键字检索方面,项目组提出了Top-k关键字检索算法,其中研究了概率XML数据分片技术,概率XML数据的索引技术和基于概率XML分区SLCA概率计算算法。.5. 本项目实施过程中,.项目组已在Information Sciences、World Wide Web Journal、NDBC、FSKD、清华大学学报等国际国内期刊和会议上发表(含已录用)论文7 篇,其中三篇SCI,4篇EI检索。培养毕业研究生2名。本项目已经严格按照计划要点进行执行,并达到预期的研究成果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

宁博的其他基金

批准号:11601379
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目

相似国自然基金

1

海量不确定XML数据查询关键技术研究

批准号:61602130
批准年份:2016
负责人:刘健
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
2

基于大规模XML数据的关键字查询处理关键技术研究

批准号:61073060
批准年份:2010
负责人:周军锋
学科分类:F0202
资助金额:33.00
项目类别:面上项目
3

模糊时空数据XML建模与查询关键技术研究

批准号:61370075
批准年份:2013
负责人:严丽
学科分类:F0202
资助金额:73.00
项目类别:面上项目
4

分布式不确定数据查询处理关键技术研究

批准号:61472425
批准年份:2014
负责人:覃飙
学科分类:F0202
资助金额:80.00
项目类别:面上项目