基于和谐竞争的有限混合模型无监督学习算法研究

基本信息
批准号:61571164
项目类别:面上项目
资助金额:62.00
负责人:刘国军
学科分类:
依托单位:哈尔滨工业大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:刘扬,任世军,李阳,潘智勇,刘培娜,王可,王瑞晨
关键词:
智能信息处理竞争学习模型选择无监督学习混合模型
结项摘要

Clustering is the most important step of intelligent information processing, in practice, the most commonly used and effective clustering method is based on finite mixture models. To identify finite mixture models, there are three levels of inference to be solved, inferring which component produce each observation, inferring the parameters of each one of K components, and inferring the number of components K, i.e., model selection. The standard expectation maximization (EM) algorithm lacks of the ability of model selection as a result of a greedy tendency, it always assigns each observation to every assumed component with a certain probability. Unlike EM, we shall further increase the negative entropy of the posterior of latent variables to exert an indirect effect on model selection. The increase of negative entropy is virtually a transition from disorder to order, and also be interpreted as a competition. It leads to a collapse from a high-dimensional space to a subspace in the probability simplex. More importantly, this competition only depends on the data itself, it has an order-preserving property and forms a highly refined and perfectly symmetrical partition in the probability simplex, hence called harmonious competition. Additionally, we also explore the singular point. Our algorithm seamlessly integrate parameter estimation and model selection into a single algorithm, which can be applied to any kind of parametric mixture model solved by an EM algorithm. In theory, it can unify other heuristic learning methods. Last, many applications in the domains of image processing, computer vision and deep structure learning of SPNs demonstrate the effectiveness of our approach on automatic model selection.

聚类是智能信息处理中一个最核心的环节,而基于有限混合模型的聚类方法是最常用有效的。有限混合模型的无监督学习涉及到三个层次的推断问题:每个样本是由哪个模型成分产生的,所有成分的模型参数,以及模型成分的个数。其中如何确定模型成分的个数,即模型选择,仍然是一个非常热门的课题。本项目提出了基于和谐竞争的学习框架,该框架将三层推断问题视为是有层次的且相互嵌套的。在完成第一层推断之后,得到隐变量的后验概率,通过增加其负熵而引入竞争。然后,直接传递给第二层推断问题中混合系数的计算,迫使某些混合系数逐渐趋于0,从而完成在第三层推断上的自动模型选择。从几何意义上讲,这种竞争是一个从高维向低维参数子空间发生坍塌的过程。更重要的,这种竞争完全是数据驱动的,并具有保序性,且在参数空间形成了一个完美的几何对称划分,因此,称之为和谐竞争。最后,通过在图像处理、视觉以及深度学习模型框架中的应用,验证本项目成果的有效性。

项目摘要

聚类是智能信息处理中一个最核心的环节,而基于有限混合模型的聚类方法是最常用有效的。本项目提出了基于和谐竞争的有限混合模型的无监督学习方法。从一个全新的角度同时解决参数学习和模型选择问题。此外,该方法还可避免底层使用EM算法时经常出现的崩溃现象,从而使算法更加稳定有效。同时,提出了基于负熵增大的完全数据驱动的和谐竞争规则。该规则与传统的启发式竞争规则相比,具有更好的鲁棒性。此外,从更深层的关系上,统一了现有的一些学习算法。从几何意义上探究了和谐竞争的本质。通过对概率单纯形空间的几何性质分析,和谐竞争的本质就是迫使混合系数在其参数空间中,从高维向低维子空间逐渐坍塌的过程,对这一过程进行深入的分析,从而可以更好地剖析与理解竞争学习背后所隐藏的原理。此外,提出了概率单纯形空间的奇异点的存在。.将和谐竞争思想融入到深度学习框架,在多个领域取得了非常好的效果。近期在研究我们提出的和谐竞争自动编码器HCAE时,发现一开始我们所有研究的理论性质都是基于概率simplex之上的,其很难在神经网络的框架上进行推广,因此,我们对其进行了扩充,并证明了在τ-simplex上仍然适用,同时给出了相关的理论证明和几何性质分析。这是理论上的一个小突破。.在深度学习框架上的推广应用。在VAE架构下,近似后验分布的选择是关键问题之一,它对VAE的可操作性和灵活性有着重要的影响。本项目提出了一种将初始简单的混合模型应用一系列可逆Householder变换可以进行任意复杂的近似后验分布的新方法。此外,我们也给出了Householder变换的详细理论和几何解释。最后,由于计算两种混合密度之间的KL距离没有封闭解。因此,我们利用它的上界重新定义了一个新的变分下界。实验结果表明,我们的方法可以更有效地提高后验分布的灵活性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

刘国军的其他基金

批准号:51408385
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:31000195
批准年份:2010
资助金额:21.00
项目类别:青年科学基金项目
批准号:61001156
批准年份:2010
资助金额:18.00
项目类别:青年科学基金项目
批准号:51301074
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:61461043
批准年份:2014
资助金额:45.00
项目类别:地区科学基金项目

相似国自然基金

1

面向图像分类的无监督迁移学习算法研究

批准号:61806213
批准年份:2018
负责人:张翔
学科分类:F0603
资助金额:22.00
项目类别:青年科学基金项目
2

基于图的半监督学习最优化模型及算法研究

批准号:11326189
批准年份:2013
负责人:吕佳
学科分类:A0405
资助金额:3.00
项目类别:数学天元基金项目
3

基于深度无监督分簇的混合监督图像语义分割方法研究

批准号:61906121
批准年份:2019
负责人:周雷
学科分类:F0604
资助金额:21.00
项目类别:青年科学基金项目
4

基于图的半监督学习算法研究

批准号:11526087
批准年份:2015
负责人:左玲
学科分类:A0205
资助金额:3.00
项目类别:数学天元基金项目