数据库查询中因果分析和解释的关键技术研究

基本信息
批准号:61772534
项目类别:面上项目
资助金额:64.00
负责人:覃飙
学科分类:
依托单位:中国人民大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:王秋月,曹巍,王大伟,孟庆钟,李晓茹,林杰,秦亚杰,刘旸
关键词:
因果分析概要解释溯源查询处理
结项摘要

With the information technology development, it is normality to perform causal analysis and explanation of database queries. The perspectives of causality and explanation are single input tuple and predicate respectively. When performing causal analysis for the result tuple of a query, this project compiles the lineage of a conjunctive query with inequality and then computes the resilience of each variable in the lineage. Because it is based on some kind of abstract to use predicates for explanation, this project will compute the synopses of input data as explanation. This project will then introduce an efficiently algorithm to satisfy this requirement. When an error occurs in the query result, we often check the input data for error. Instead, this project will check the query log to find the errors in data and repair those errors. Further, if we monitor anomalies in event stream, this project will propose an algorithm to transform raw data into feature space in an automatic way. We use a new entropy-based distance function to calculate feature space and optimally model the explanation from the feature space. Finally, a causal analysis and explanation prototype is implemented based on the techniques developed in this project. This prototype is used to demonstrate our theories and algorithms. This project is not only useful for causal analysis and explanation for database queries but also for combining databases and artificial intelligence.

由于现代信息技术的发展,对数据库查询处理的结果进行因果分析或解释将成为一种常态,其中因果分析和解释的视角分别是单个源元组和谓词。在对查询处理进行因果分析时,本项目通过编辑不等式连接查询溯源表达式,来计算其各个变量的弹性。因为基于谓词的解释采用了某种抽象,本项目拟进一步计算出输入数据的概要作为解释,并将提出高效的算法来满足这种需要。当查询的结果出现错误时,通常以检测输入数据为主,本项目希望通过查询日志来发现数据错误的根本原因和修复查询本身的错误。进一步当在事件流中监测到异常时,本项目拟提出算法来自动地把原始数据转换为特征空间,并采用基于熵的距离函数计算特征空间,然后把从特征值得来的解释进行优化建模处理。最后,研发一个数据库查询中因果分析和解释的原型系统,对本项目提出的理论和算法进行验证和分析。本项目的工作不仅对数据库查询中因果分析和解释有直接意义,而且对数据库和人工智能的有机结合有理论指导。

项目摘要

由于现代信息技术的发展,对数据库查询处理的结果进行因果分析或解释将成为一种常态,其中因果分析和解释的视角分别是单个源元组和谓词。在对查询处理进行因果分析时,本项目通过编辑不等式连接查询溯源表达式,来计算其各个变量的弹性。因为基于谓词的解释采用了某种抽象,本项目进一步计算出输入数据的概要作为解释,并提出高效的算法来满足这种需要。当查询的结果出现错误时,以检测输入数据为主,本项目通过查询日志来发现数据错误的根本原因和修复查询本身的错误。进一步当在事件流中监测到异常时,本项目提出算法来自动地把原始数据转换为特征空间,并采用基于熵的距离函数计算特征空间,然后把从特征值得来的解释进行优化建模处理。最后,构建了一个数据库查询中因果分析和解释的原型系统,对本项目提出的理论和算法进行验证和分析。本项目的工作不仅对数据库查询中因果分析和解释有直接意义,而且对数据库和人工智能的有机结合有理论指导。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

覃飙的其他基金

批准号:61170012
批准年份:2011
资助金额:55.00
项目类别:面上项目
批准号:61472425
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:60503038
批准年份:2005
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

外包数据库中敏感数据保护和查询处理关键技术研究

批准号:61073018
批准年份:2010
负责人:高军
学科分类:F0202
资助金额:33.00
项目类别:面上项目
2

概率数据库查询处理关键技术研究

批准号:61170012
批准年份:2011
负责人:覃飙
学科分类:F0202
资助金额:55.00
项目类别:面上项目
3

基于关键词的关系数据库查询技术研究

批准号:61303004
批准年份:2013
负责人:林子雨
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目
4

数据库的新型查询技术研究

批准号:61003004
批准年份:2010
负责人:李国良
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目