We live in an era full of massive information and big data. How to undermine those uncertainty information from high dimensional and big data is an important question not only for industry and business areas but also for the communities of Statistics, Machine Learning and Data Mining. Bayesian network, originating from Artificial Intelligence, is a strong tool for studying those uncertainty problems. It has influenced many areas profoundly in recent years. Facing with high dimensional complex data, some decomposition of high dimensional Bayesian network can reduce the complexity of the data and statistical models. Though there are fully-fledged theories for undirected graphical models, the development of the decomposition and collapsibility is very slow for Bayesian network. Currently, all the decomposition theories for Bayesian network are basing on the moral graph of Bayesian network. In our study, we plan to build a new decomposition theory directly on Bayesian network, and develop further tools for the collapsibility and decomposition of Bayesian network.
我们生活在一个海量数据的时代。如何从高维海量数据中挖掘并研究不确定性信息,不仅是企业界、商业界关心的应用问题,也应作为我们统计领域、机器学习与数据挖掘领域所关心的核心理论问题之一。贝叶斯网作为研究不确定性问题的一个重要工具,起源于人工智能领域的研究,近年来对众多其他领域也产生了深刻影响。面对高维复杂数据,通过高维的贝叶斯网的某种分解,可以减低数据或是统计模型的复杂程度。虽然,人们在无向图模型的分解性和可压缩性研究方面取得了比较完备的结果,但是,贝叶斯网的分解理论和可压缩理论却进展缓慢。目前所有有关贝叶斯网的分解理论都是建立在贝叶斯网的道义图上。在本项目的研究中,我们要研究直接建立在贝叶斯网上的新的分解理论,并基于新的分解方式进一步研究贝叶斯网的可压缩性和结构学习。
随着“互联网+”时代到来,全球数据爆发增长、海量集聚,以大数据、人工智能为代表的新一代信息技术发展迅速,已成为新一代产业革命的核心驱动力。贝叶斯网作为从海量数据中挖掘和研究不确定性信息的一种重要而常用的工具,近年来在人工智能、数据分析和模式识别等各个领域都有重要的应用。随着海量数据的聚集,数据集的维数之大以及各变量间的关系之复杂越来越超乎人们的想象。因此,面对如此高维复杂数据,研究大规模贝叶斯网的可分解性与可压缩性已是当务之急。..本项目在统计学和计算机科学的应用背景下,结合图论的研究方法,并以建立贝叶斯网的分解理论及其应用为目标。在项目的执行期内我们重点研究了以下内容并取得了一些重要研究成果:一是研究并建立了基于有向无圈图的变量消元理论;二是基于我们提出的变量消元理论,发现了贝叶斯网的模型可压缩性和估计可压缩的若干等价条件,并且用图论的语言给出了一个直观的刻画;三是初步给出了贝叶斯网可分解的条件,为建立贝叶斯网的分解理论提供了必要准备。 以上研究成果是我们下一步解决寻找最小关心点集的可压缩集以及基于分解的贝叶斯网的结构学习的理论基础。贝叶斯网分解理论的建立将有效提升贝叶斯网的概率推理和结构学习效率,同时也将有利于解决贝叶斯网的无损分解、团树校准、关系数据库分解理论、链图的分解等问题。最后,值得指出的是无向图模型中的分解和可压缩性理论都是我们研究结果的特例。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
贝叶斯网分解理论及其应用
混合贝叶斯网的概率推理
基于关系数据理论的贝叶斯网生成方法
多任务贝叶斯网络学习及其应用