由于客观世界的复杂性,不确定信息普遍存在;在很多应用中,例如经济、军事、物流、金融、电信等领域,不确定性数据扮演着关键角色;在很多情况下,不确定数据是连续分布的,连续不确定数据可以用连续概率密度函数表示。本项目研究连续不确定XML数据管理关键技术,包括:建立数据模型,支持连续不确定XML数据;支持概率密度函数beta,gamma,gauss和均匀分布,支持联合概率分布和条件概率分布,给出数据模型语义基础;基于统计理论和概率理论,探索连续不确定数据查询处理技术,设计查询策略使其根据要查询的连续分布的类型选择适当的分布特征计算方法,给出查询的语义基础;研究上述模型和查询支持多个随机变量,研究连续不确定数据的聚集查询、更新技术、查询优化技术、查询代价评估等。通过上述系列问题的研究,拓展目前不确定XML数据管理研究领域,提供了连续不确定XML数据管理的新理论和新方法,丰富和完善不确定数据管理理论。
随着数据采集和数据处理技术的不断发展,不确定性数据受到广泛关注。不确定性数据包含离散性不确定数据和连续性不确定数据。连续性不确定数据以用一个连续分布函数来表示,并普遍存在于军事、电信、经济、物流等领域中。XML具有自描述性好、可扩展性高和灵活性好的特点,特别适用于不确定性数据管理。连续不确定XML数据管理技术研究涉及统计理论、概率理论、数据库技术、网络技术等多个领域,是具有挑战性的研究课题。对其进行理论和方法的研究可以为传感器数据、科学数据和地理学信息等应用提供理论基础和技术支持,具有重要的理论和应用研究价值。.研究内容主要包括:连续不确定XML数据模型、数据编码、索引技术、小枝查询、复杂小枝查询、多维数据查询、Top-k查询、关键字查询等。.(1)多维连续不确定XML数据模型。连续不确定XML数据模型支持多维连续随机变量的不确定XML数据表示,并能够有效地表示一维及多维连续分布函数,包括二维高斯及均匀分布等标准分布函数,高效地处理不确定XML中的多维连续数据。.(2)连续不确定XML数据索引。通过重复利用小素数编码并根据码值之间素数因子的包含关系能够快速、精准地判定出XML树中任意两个节点的结构关系,并且该编码方式可以支持连续不确定XML文档更新;提出连续不确定XML数据的节点编码索引技术和结构概要索引技术。.(3)连续不确定XML数据查询。在小素数编码的基础上,提出一种非归并不确定XML小枝模式查询;包含通配符和复杂谓词的不确定XML复杂小枝查询;基于序列的不确定XML查询;基于蒙特卡罗思想多维连续不确定XML数据查询,以及基于最小二乘法的连续不确定XML 数据同步多区间查询。.(4)连续不确定XML数据Top-k查询。扩展PEDewey编码支持连续分布类型节点的编码,定义连续不确定XML 数据查询结果的概率值计算公式;提出并实现高效的连续不确定XML 数据Top-k 查询算法,并设计过滤策略进一步提高算法的效率。.(5)不确定XML关键字查询。首先基于SLCA 语义,设计了动态Keyword数据仓,并基于动态Keyword数据仓设计一种求解不确定XML 关键字查询的算法。然后,提出一种基于最小相关联通子树的Top-k语义,根据此语义提出了一种不确定XML关键字查询算法,且根据不同的查询条件设计不同的过滤策略来进一步提高查询效率。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
一种改进的多目标正余弦优化算法
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
模糊XML数据管理若干关键技术研究
可扩展的高效XML数据管理关键技术研究
云计算环境下海量XML数据管理关键技术研究
不确定XML数据查询处理关键技术研究