概率数据库查询处理关键技术研究

基本信息
批准号:61170012
项目类别:面上项目
资助金额:55.00
负责人:覃飙
学科分类:
依托单位:中国人民大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:张孝,曹巍,张倩,卢贤玲,谢湘伟,田宗起,苏浩,郭凡
关键词:
世系图内涵查询策略概率数据库概率图模型外延执行计划
结项摘要

由于测量精度限制、网络延迟以及采样误差等因素导致不确定数据在现实生活中无处不在,我们用概率数据库来管理这些不确定数据。当概率数据库采用元组关联模型时,我们拟用图模型来表达它们,并用一阶概率图模型来描述其结果元组的推理过程;还要研究查询语句安全的充要条件,并提出生成安全外延执行计划的算法。当概率数据库采用元组独立模型时,本项目拟根据结果元组世系图的特点,从图论提出判断结果元组为只读一次范式的理论,并导出元组概率的推理算法。本项目拟研究查询语句与贝叶斯网络推理方法之间的映射关系,并在此基础上生成优化的安全计划或高效的内涵查询策略。本项目还将研究协同内涵和外延两种基本策略来高效地执行非安全查询语句的技术,并通过索引和物化视图来提高系统的性能。最后,研发一个概率数据库原型系统,对我们提出的理论和算法进行验证和分析。本项目的工作不仅对概率数据库查询处理有直接的意义,而且对其存储管理等方面有理论指导。

项目摘要

数据的不确定性在很多领域都有,比如传感器网络和RFID网络,我们用概率数据库来管理这些不确定数据。本项目研究块分离概论数据库上的安全执行计划,该问题是概论数据库的一个基本问题。我们提出了两种新的数据模型,关联表和扩展的关联表;接着我们提出了一种混合的投影,它的原子操作包括首先执行不相交投影然后执行独立投影在BID表上;此外,我们提出了一种高效的算法来在BID中找到安全的执行计划。本项目还研究了元组独立的概率数据库中不等式查询,这类查询分为路径类型、树类型和图类型,并提出了高效的查询处理策略来计算不等式查询的概率。.经典的数据挖掘算法需要修改和扩充来挖掘不确定数据对象,否则挖掘的精度将由于数据的不确定性而大大降低。我们为不确定的数值属性和字符属性定义了不确定数据模型,在此基础上提出新的EMU算法来聚类不确定数据对象。该算法经过精心设计基于不确定数据对象发现分布式参数以便最大化模型的质量,因此能够正确的区分不同的类。我们的聚类算法能够处理数值和字符数据,在实验中我们采用合成的和真实数据来评估我们算法的高效性和健壮性。.贝叶斯网络能够推导出事件的概率,是典型的不确定推理应用。微分和干预分别是贝叶斯网络和因果网的基本操作,我们揭示了这两种操作的联系,我们首先提出了一个新的表示模型部分干预表(PIT)来编码因果网中对一个结点的多干预。利用PIT,我们引入了联合树算法来求因果网中所有变量的全干预。我们接着发现经典算法只有当微分结点能够到达证据结点时才能够正确计算贝叶斯网络的微分。如果该条件不能满足,经典算法将不能正确计算微分。基于此,我们发现干预的微分语义。.连接查询语句的结果元组在世系的责任问题,我们把一类IQ查询的世系分为路径世系和复合世系。我们首先把路径世系编辑为世系图,然后把世系图转换为矩阵。接着我们把计算路径世系责任的问题归约为最小路径问题,该问题能够把动态规划算法在PTIME时间内求解。本项目进一步证明复合世系的责任能够分解为路径世系的责任求解。因此,本项目的第一个主要结论是IQ查询世系的责任能够在PTIME时间内求解。我们把先前的求解世系责任在等值连接查询推广到不等值连接查询。当把复合世系分解为路径世系后,进行责任计算的数据量降低了超过一个数量级。因此我们的算法能够高效地计算复合世系的责任。最后,本项目提出了一个贪婪算法,它把计算一般世系的责任归约为集合覆盖问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019

覃飙的其他基金

批准号:61772534
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:61472425
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:60503038
批准年份:2005
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

外包数据库中敏感数据保护和查询处理关键技术研究

批准号:61073018
批准年份:2010
负责人:高军
学科分类:F0202
资助金额:33.00
项目类别:面上项目
2

基于关键词的关系数据库查询技术研究

批准号:61303004
批准年份:2013
负责人:林子雨
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目
3

Cache访问优化的空间数据库查询处理技术研究

批准号:41271403
批准年份:2012
负责人:熊伟
学科分类:D0114
资助金额:75.00
项目类别:面上项目
4

高维数据库的有效相似查询处理

批准号:60603045
批准年份:2006
负责人:崔斌
学科分类:F0202
资助金额:29.00
项目类别:青年科学基金项目