As an important class of statistical machine learning models for exploring the interrelationship among a large number of random variables, undirected graphical models (UGMs) have enjoyed popularity in the practice of pattern recognition,data mining and image processing. The general form for a probability density encoded by a UGM is expressed as an exponential family distribution. Therefore, UGMs are also known as exponential family graphical models. The most popular exponential family graphical models include Gaussian graphical models and Ising graphical models. In practice, however,these models are too stringent in distribution assumption to be useful for modeling complex unknown interactions among variables. In this project, we will investigate theory, algorithms and applications of general exponential family graphical models. The problems we are going to explore include: nonlinear sufficient statistics based exponential family graphical models, conditional exponential graphical models, as well as latent and deep architecture exponential graphical models. We plan to use the sparsity-inducing norm regularized log-likelihood maximization method for graph parameter and structure estimation, aiming to analyze its high-dimensional statistical efficiency and develop efficient algorithms for optimization. Moreover, we will study the applications of these models to several important image massive data analysis problems, including image subspace clustering and image classification tasks.
无向图模型是研究统计机器学习问题重要的分析工具之一,可用于探索大量随机变量之间的条件相关性,广泛应用于模式识别,数据挖掘和图像处理等领域的实际问题。一般而言,无向图模型所对应的概率分布可以由指数族分布表达。因此,无向图模型又称为指数族图模型。目前最常用的指数族图模型包括高斯图模型和Ising图模型。这些模型的缺点是需要对数据的分布形式予以特定的假设,因此不适用于描述实际数据之间未知的复杂交互关系。本项目研究广义形式的指数族图模型的理论、算法及应用。主要探讨基于非线性充分统计量的指数族图模型、条件指数族图模型以及隐变量和深度指数族图模型的参数估计问题。拟采用基于稀疏正则化约束的最大似然估记方法学习图模型的参数和结构,分析其高维统计性质并开发高效算法进行优化。同时,我们将研究这些模型在图像大数据处理中的应用,包括图像子空间聚类和图像分类等任务。
无向图模型是研究统计机器学习问题重要的分析工具之一,可用于探索大量随机变量之间的条件相关性,广泛应用于模式识别,数据挖掘和图像处理等领域的实际问题。一般而言,无向图模型所对应的概率分布可以由指数族分布表达。因此,无向图模型又称为指数族图模型。目前最常用的指数族图模型包括高斯图模型和Ising图模型。这些模型的缺点是需要对数据的分布形式予以特定的假设,因此不适用于描述实际数据之间未知的复杂交互关系。本项目研究广义形式的指数族图模型的理论、算法及应用。主要探讨基于非线性充分统计量的指数族图模型、条件指数族图模型以及隐变量和深度指数族图模型的参数估计问题。拟采用基于稀疏正则化约束的最大似然估记方法学习图模型的参数和结构,分析其高维统计性质并开发高效算法进行优化。同时,我们将研究这些模型在图像大数据处理中的应用,包括图像子空间聚类和图像分类等任务。.在本课题资助下,我们围绕相关研究内容做了大量的工作,取得了一系列研究成果,超额完成了预期的研究目标。在国内外学术期刊和会议上发表和录用论文18篇,其中包括IEEE和ACM汇刊论文5篇(第一作者2篇),中国计算机学会(CCF)推荐排名A类期刊论文1篇(第一作者)以及CCF推荐排名A类会议8篇(第一作者2篇)等。论文SCI收录7篇(S含一区4篇),EI收录15篇。已申请发明专利4项。课题负责人2015年获得国家自然科学基金优秀青年基金资助;2016年获得教育部高等学校科学研究优秀成果奖(自然科学)二等奖(第4完成人);2015年获得IEEE Trans. on Multimedia (IEEE T-MM) 最佳论文提名;2017年获得ImageNet Large Scale Visual Recognition Challenge 2017 (ILSVRC2017)国际竞赛(计算机视觉领域著名国际竞赛)图像物体检测任务第1名;2017年作为骨干成员入选教育部首批认定“黄大年式教师团队”(已公示)。.本课题的研究成果显著推动了指数族图模型理论、稀疏优化算法分析、大规模自然图像识别等方向的研究进展,为课题组成员的后续相关研究工作打下坚实的基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
黄河流域水资源利用时空演变特征及驱动要素
概率图模型学习及其在数据分析中的应用研究
指数族非线性模型的理论及其应用
结合图像分析的非参数随机效应模型及其在临床医学数据中的应用研究
图嵌入方法在大规模数据密集型系统中的应用研究