连续不确定XML数据管理关键技术研究

基本信息
批准号:61163015
项目类别:地区科学基金项目
资助金额:49.00
负责人:张晓琳
学科分类:
依托单位:内蒙古科技大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:谭跃生,王静宇,褚燕华,王丽颖,孙斌,丁雨,刘立新,郝斌,张甄
关键词:
连续不确定数据查询优化数据模型XML数据查询处理
结项摘要

由于客观世界的复杂性,不确定信息普遍存在;在很多应用中,例如经济、军事、物流、金融、电信等领域,不确定性数据扮演着关键角色;在很多情况下,不确定数据是连续分布的,连续不确定数据可以用连续概率密度函数表示。本项目研究连续不确定XML数据管理关键技术,包括:建立数据模型,支持连续不确定XML数据;支持概率密度函数beta,gamma,gauss和均匀分布,支持联合概率分布和条件概率分布,给出数据模型语义基础;基于统计理论和概率理论,探索连续不确定数据查询处理技术,设计查询策略使其根据要查询的连续分布的类型选择适当的分布特征计算方法,给出查询的语义基础;研究上述模型和查询支持多个随机变量,研究连续不确定数据的聚集查询、更新技术、查询优化技术、查询代价评估等。通过上述系列问题的研究,拓展目前不确定XML数据管理研究领域,提供了连续不确定XML数据管理的新理论和新方法,丰富和完善不确定数据管理理论。

项目摘要

随着数据采集和数据处理技术的不断发展,不确定性数据受到广泛关注。不确定性数据包含离散性不确定数据和连续性不确定数据。连续性不确定数据以用一个连续分布函数来表示,并普遍存在于军事、电信、经济、物流等领域中。XML具有自描述性好、可扩展性高和灵活性好的特点,特别适用于不确定性数据管理。连续不确定XML数据管理技术研究涉及统计理论、概率理论、数据库技术、网络技术等多个领域,是具有挑战性的研究课题。对其进行理论和方法的研究可以为传感器数据、科学数据和地理学信息等应用提供理论基础和技术支持,具有重要的理论和应用研究价值。.研究内容主要包括:连续不确定XML数据模型、数据编码、索引技术、小枝查询、复杂小枝查询、多维数据查询、Top-k查询、关键字查询等。.(1)多维连续不确定XML数据模型。连续不确定XML数据模型支持多维连续随机变量的不确定XML数据表示,并能够有效地表示一维及多维连续分布函数,包括二维高斯及均匀分布等标准分布函数,高效地处理不确定XML中的多维连续数据。.(2)连续不确定XML数据索引。通过重复利用小素数编码并根据码值之间素数因子的包含关系能够快速、精准地判定出XML树中任意两个节点的结构关系,并且该编码方式可以支持连续不确定XML文档更新;提出连续不确定XML数据的节点编码索引技术和结构概要索引技术。.(3)连续不确定XML数据查询。在小素数编码的基础上,提出一种非归并不确定XML小枝模式查询;包含通配符和复杂谓词的不确定XML复杂小枝查询;基于序列的不确定XML查询;基于蒙特卡罗思想多维连续不确定XML数据查询,以及基于最小二乘法的连续不确定XML 数据同步多区间查询。.(4)连续不确定XML数据Top-k查询。扩展PEDewey编码支持连续分布类型节点的编码,定义连续不确定XML 数据查询结果的概率值计算公式;提出并实现高效的连续不确定XML 数据Top-k 查询算法,并设计过滤策略进一步提高算法的效率。.(5)不确定XML关键字查询。首先基于SLCA 语义,设计了动态Keyword数据仓,并基于动态Keyword数据仓设计一种求解不确定XML 关键字查询的算法。然后,提出一种基于最小相关联通子树的Top-k语义,根据此语义提出了一种不确定XML关键字查询算法,且根据不同的查询条件设计不同的过滤策略来进一步提高查询效率。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

张晓琳的其他基金

批准号:30800491
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:31300092
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:31800381
批准年份:2018
资助金额:28.00
项目类别:青年科学基金项目
批准号:81370616
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:61108073
批准年份:2011
资助金额:30.00
项目类别:青年科学基金项目
批准号:21102014
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:31670055
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:61562065
批准年份:2015
资助金额:37.00
项目类别:地区科学基金项目

相似国自然基金

1

模糊XML数据管理若干关键技术研究

批准号:60873010
批准年份:2008
负责人:马宗民
学科分类:F0202
资助金额:31.00
项目类别:面上项目
2

可扩展的高效XML数据管理关键技术研究

批准号:61170011
批准年份:2011
负责人:陆嘉恒
学科分类:F0202
资助金额:56.00
项目类别:面上项目
3

云计算环境下海量XML数据管理关键技术研究

批准号:61272181
批准年份:2012
负责人:赵相国
学科分类:F0202
资助金额:81.00
项目类别:面上项目
4

不确定XML数据查询处理关键技术研究

批准号:61202083
批准年份:2012
负责人:宁博
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目