数据库查询中因果分析和解释的关键技术研究

基本信息

批准号：61772534

项目类别：面上项目

资助金额：64.00

负责人：覃飙

学科分类：

依托单位：中国人民大学

批准年份：2017

结题年份：2021

起止时间：2018-01-01 - 2021-12-31

项目状态：已结题

项目参与者：王秋月,曹巍,王大伟,孟庆钟,李晓茹,林杰,秦亚杰,刘旸

关键词：

因果分析概要解释溯源查询处理

结项摘要

With the information technology development, it is normality to perform causal analysis and explanation of database queries. The perspectives of causality and explanation are single input tuple and predicate respectively. When performing causal analysis for the result tuple of a query, this project compiles the lineage of a conjunctive query with inequality and then computes the resilience of each variable in the lineage. Because it is based on some kind of abstract to use predicates for explanation, this project will compute the synopses of input data as explanation. This project will then introduce an efficiently algorithm to satisfy this requirement. When an error occurs in the query result, we often check the input data for error. Instead, this project will check the query log to find the errors in data and repair those errors. Further, if we monitor anomalies in event stream, this project will propose an algorithm to transform raw data into feature space in an automatic way. We use a new entropy-based distance function to calculate feature space and optimally model the explanation from the feature space. Finally, a causal analysis and explanation prototype is implemented based on the techniques developed in this project. This prototype is used to demonstrate our theories and algorithms. This project is not only useful for causal analysis and explanation for database queries but also for combining databases and artificial intelligence.

由于现代信息技术的发展，对数据库查询处理的结果进行因果分析或解释将成为一种常态，其中因果分析和解释的视角分别是单个源元组和谓词。在对查询处理进行因果分析时，本项目通过编辑不等式连接查询溯源表达式，来计算其各个变量的弹性。因为基于谓词的解释采用了某种抽象，本项目拟进一步计算出输入数据的概要作为解释，并将提出高效的算法来满足这种需要。当查询的结果出现错误时，通常以检测输入数据为主，本项目希望通过查询日志来发现数据错误的根本原因和修复查询本身的错误。进一步当在事件流中监测到异常时，本项目拟提出算法来自动地把原始数据转换为特征空间，并采用基于熵的距离函数计算特征空间，然后把从特征值得来的解释进行优化建模处理。最后，研发一个数据库查询中因果分析和解释的原型系统，对本项目提出的理论和算法进行验证和分析。本项目的工作不仅对数据库查询中因果分析和解释有直接意义，而且对数据库和人工智能的有机结合有理论指导。

项目摘要

由于现代信息技术的发展，对数据库查询处理的结果进行因果分析或解释将成为一种常态，其中因果分析和解释的视角分别是单个源元组和谓词。在对查询处理进行因果分析时，本项目通过编辑不等式连接查询溯源表达式，来计算其各个变量的弹性。因为基于谓词的解释采用了某种抽象，本项目进一步计算出输入数据的概要作为解释，并提出高效的算法来满足这种需要。当查询的结果出现错误时，以检测输入数据为主，本项目通过查询日志来发现数据错误的根本原因和修复查询本身的错误。进一步当在事件流中监测到异常时，本项目提出算法来自动地把原始数据转换为特征空间，并采用基于熵的距离函数计算特征空间，然后把从特征值得来的解释进行优化建模处理。最后，构建了一个数据库查询中因果分析和解释的原型系统，对本项目提出的理论和算法进行验证和分析。本项目的工作不仅对数据库查询中因果分析和解释有直接意义，而且对数据库和人工智能的有机结合有理论指导。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.3969/j.issn.1000-0844.2017.05.0820

发表时间：2017

DOI：10.7500/aeps20191122006

发表时间：2020

覃飙的其他基金

批准号：61170012

批准年份：2011

资助金额：55.00

项目类别：面上项目

批准号：61472425

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：60503038

批准年份：2005

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

外包数据库中敏感数据保护和查询处理关键技术研究

批准号：61073018

批准年份：2010

负责人：高军

学科分类：F0202

资助金额：33.00

项目类别：面上项目

概率数据库查询处理关键技术研究

批准号：61170012

批准年份：2011

负责人：覃飙

学科分类：F0202

资助金额：55.00

项目类别：面上项目

基于关键词的关系数据库查询技术研究

批准号：61303004

批准年份：2013

负责人：林子雨

学科分类：F0202

资助金额：23.00

项目类别：青年科学基金项目

数据库的新型查询技术研究

批准号：61003004

批准年份：2010

负责人：李国良

学科分类：F0202

资助金额：21.00

项目类别：青年科学基金项目

数据库查询中因果分析和解释的关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

基于暂态波形相关性的配电网故障定位方法

覃飙的其他基金

概率数据库查询处理关键技术研究

分布式不确定数据查询处理关键技术研究

基于语义映射Peer数据管理系统的关键技术研究

相似国自然基金