With the information technology development, it is normality to perform causal analysis and explanation of database queries. The perspectives of causality and explanation are single input tuple and predicate respectively. When performing causal analysis for the result tuple of a query, this project compiles the lineage of a conjunctive query with inequality and then computes the resilience of each variable in the lineage. Because it is based on some kind of abstract to use predicates for explanation, this project will compute the synopses of input data as explanation. This project will then introduce an efficiently algorithm to satisfy this requirement. When an error occurs in the query result, we often check the input data for error. Instead, this project will check the query log to find the errors in data and repair those errors. Further, if we monitor anomalies in event stream, this project will propose an algorithm to transform raw data into feature space in an automatic way. We use a new entropy-based distance function to calculate feature space and optimally model the explanation from the feature space. Finally, a causal analysis and explanation prototype is implemented based on the techniques developed in this project. This prototype is used to demonstrate our theories and algorithms. This project is not only useful for causal analysis and explanation for database queries but also for combining databases and artificial intelligence.
由于现代信息技术的发展,对数据库查询处理的结果进行因果分析或解释将成为一种常态,其中因果分析和解释的视角分别是单个源元组和谓词。在对查询处理进行因果分析时,本项目通过编辑不等式连接查询溯源表达式,来计算其各个变量的弹性。因为基于谓词的解释采用了某种抽象,本项目拟进一步计算出输入数据的概要作为解释,并将提出高效的算法来满足这种需要。当查询的结果出现错误时,通常以检测输入数据为主,本项目希望通过查询日志来发现数据错误的根本原因和修复查询本身的错误。进一步当在事件流中监测到异常时,本项目拟提出算法来自动地把原始数据转换为特征空间,并采用基于熵的距离函数计算特征空间,然后把从特征值得来的解释进行优化建模处理。最后,研发一个数据库查询中因果分析和解释的原型系统,对本项目提出的理论和算法进行验证和分析。本项目的工作不仅对数据库查询中因果分析和解释有直接意义,而且对数据库和人工智能的有机结合有理论指导。
由于现代信息技术的发展,对数据库查询处理的结果进行因果分析或解释将成为一种常态,其中因果分析和解释的视角分别是单个源元组和谓词。在对查询处理进行因果分析时,本项目通过编辑不等式连接查询溯源表达式,来计算其各个变量的弹性。因为基于谓词的解释采用了某种抽象,本项目进一步计算出输入数据的概要作为解释,并提出高效的算法来满足这种需要。当查询的结果出现错误时,以检测输入数据为主,本项目通过查询日志来发现数据错误的根本原因和修复查询本身的错误。进一步当在事件流中监测到异常时,本项目提出算法来自动地把原始数据转换为特征空间,并采用基于熵的距离函数计算特征空间,然后把从特征值得来的解释进行优化建模处理。最后,构建了一个数据库查询中因果分析和解释的原型系统,对本项目提出的理论和算法进行验证和分析。本项目的工作不仅对数据库查询中因果分析和解释有直接意义,而且对数据库和人工智能的有机结合有理论指导。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于SSVEP 直接脑控机器人方向和速度研究
外包数据库中敏感数据保护和查询处理关键技术研究
概率数据库查询处理关键技术研究
基于关键词的关系数据库查询技术研究
数据库的新型查询技术研究