Knowledge discovery of relational database is one of the hottest research topics at home and abroad, it has important practical significance for industrial and medical diagnosis, intelligent software, financial risk analysis and other data mining application fields. Bayesian network is considered as the main research direction for combination of relation model and probabilistic relations, but it can't apply conditional reasoning from numerical point of view. Based on relational normalization theory, this project combines with Conditional Event Algebra to build data-causal description framework, reduces dependency relationship and simplifies the procedure of probability reasoning by using the probabilistic reasoning rules, reveals the information flow schema implicated in data dependency based on research of information theory, then builds Probability-logic Bayesian network to completely describe all dependency relationships. And this project tries to analyze the relationship between conditional independence and d-separation from the viewpoint of data dependency and mutual information, project the description of relational dependency to local structure of Bayesian network based on Production Space Conditional Event Algebra, thus solves the problem of realization of Probability-logic Bayesian network. This project combines the numerical viewpoint with algebra viewpoint and studies the problem of knowledge discovery of relation database. It will satisfy the urgent need of knowledge discovery of relational database from all social sectors and give novel ideas and theory basis for further research of Bayesian network.
关系数据库知识发现是目前国内外研究的热点,它对于工业与医疗诊断、软件智能化、金融风险分析等需要关系数据挖掘的应用领域有着重要的实际意义。贝叶斯网络被视为关系模型和概率关系相结合的主要研究方向,但基于数值的观点无法进行条件推理。本项目以关系数据规范化理论为基础,结合条件事件代数建立数据-因果依赖描述框架,根据概率推理规则进行依赖关系约简并进而简化概率推理过程,通过对信息论的扩展性研究揭示数据依赖所蕴含的信息流动方式,从而构造可以完备描述依赖关系的概率逻辑贝叶斯网络空间数据模型。同时分别从数据依赖和互信息角度分析条件独立性和d-分隔之间的联系,基于乘积空间条件事件代数将依赖关系概念性描述映射成贝叶斯网络的局部扩展结构,解决概率逻辑贝叶斯网络的实现问题。本项目融合基于数值和代数的观点构建贝叶斯网络,既是为了满足社会各行业对关系数据库知识发现的迫切需求,也可为贝叶斯网络研究提供新思路和理论依据。
关系数据库知识发现是目前国内外研究的热点,它对于工业与医疗诊断、软件智能化、金融风险分析等需要关系数据挖掘的应用领域有着重要的实际意义。贝叶斯网络被视为关系模型和概率关系相结合的主要研究方向,但基于数值的观点无法进行条件推理。本项目以关系数据规范化理论为基础,建立概率-逻辑依赖描述框架。研究内容主要涉及根据概率推理规则进行依赖关系约简并进而简化概率推理过程、通过对信息论的扩展性研究揭示数据依赖所蕴含的信息流动方式、从数据依赖和互信息角度分析各要素之间的因果联系、将因果依赖关系概念性描述映射成贝叶斯网络的局部扩展结构,从而构造可以完备描述依赖关系的概率逻辑贝叶斯网络空间数据模型,解决贝叶斯网络的正逆向推理问题。提出并证明了函数依赖的概率表达等价形式;提出对应于Armstrong公理系统的完备性概率函数依赖规则,以及在函数依赖约束下确定冗余变量应遵循的基本原则;建立不同情况下函数依赖所对应的条件独立性概率表达形式;通过建立全概率的链规则分解和图模式的对应关系,推导出条件概率和互信息的映射关系,提出贝叶斯分类模型构建的2个基本要素:变量有序性和父子变量间的强相关性;对于贝叶斯分类模型的连续属性概率密度问题,在高斯网络理论的基础上,给出了联合高斯密度的分解与组合定理,以及条件高斯密度计算定理,为属性联合密度的分解计算提供理论依据和实现方法;通过Copula进行高斯函数与高斯核函数的整合,来实现它们之间的优势互补。给出了基于高斯Copula的属性联合密度分解计算和条件密度估计的方法,有效降低高斯Copula密度函数的运算复杂性并提高可靠性。本项目的研究成果不仅提高了贝叶斯网络分类器的性能和实用性,拓宽了其应用领域和应用范围,项目成果具有重要的理论意义和实践价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
城市轨道交通车站火灾情况下客流疏散能力评价
基于贝叶斯本体的Web知识发现研究
贝叶斯网络的结构学习,用于数据挖掘与知识发现
混合贝叶斯网的概率推理
面向风险管理的贝叶斯网络与集成研究