基于熵准则的非监督特征学习方法研究

基本信息
批准号:61802036
项目类别:青年科学基金项目
资助金额:26.00
负责人:周楠
学科分类:
依托单位:成都信息工程大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:徐扬扬,刘俊,付克昌,周爽,彭莉斯,孟易
关键词:
数据挖掘熵准则无监督学习特征学习信息论学习
结项摘要

With the improving of sensor and internet technology, nowadays it is more difficult to label the training data than to obtain them. Therefore, the unsupervised and semi-supervised learning technology becomes a hot topic for researchers. This research project focuses on the situations that the training data contain lots of unknown distributed noise and outliers in unsupervised and semi-supervised learning scenario, and we do some researches based on entropy criterion measure in the following three parts:.1).In order to control or eliminate the effects of noise and outliers in unsupervised and semi-supervised learning scenario and efficiently utilize a small amount of data’s label information, we will do some researches on the entropy criterion measure and data’s global information based robust feature learning model..2).In order to improve the discriminability and eliminate the effects of noise and outliers, we will do some researches on entropy criterion measure based regularization term which can adaptively incorporation both data’s label information and local structure information..3).Because of the extreme non-convexity of entropy criterion measure based objective function, we will do some researches and propose a solving algorithm to solve the proposed entropy measure based model. We hope that the proposed solving strategy has good convergence property and low computational complexity.. The model strategy and solving algorithm of this research project can be extended to other machine learning and pattern recognition applications,thus this research project have high application value.

随着传感器及互联网技术的不断进步,如今数据获取的难度远远低于对数据进行类别标记的难度,因此,非监督特征学习方法成为当今研究的一个热点。本项目针对非监督学习场景下存在未知分布噪声及局外点的情况,拟采用基于熵准则的鲁棒度量来进行如下三个方面的内容进行研究:1)在非监督场景中,为了消除或抑制噪声和局外点的影响且充分利用在半监督场景中少量数据类别信息,对基于熵准则度量及数据全局重构信息的鲁棒特征学习模型进行研究。2)在非监督场景中,为了增强特征学习的判别性和抑制噪声及局外点的影响,对基于熵准则度量的自适应局部结构学习正则项进行研究。3)由于基于熵准则度量的极度非凸性,对基于熵准则的特征学习模型求解的算法进行研究。该算法应具有较好的收敛性和较低的计算复杂度。本项目建模方法和求解办法可以拓展来解决机器学习和模式识别中的其他相关应用,因此本项目的研究成果具有较高的应用价值。

项目摘要

随着传感器技术及互联网技术的不断进步,如今数据获取的难度远远低于对数据进行类别标记的难度,因此,非监督特征学习方法成为当今研究的一个热点。本项目针对非监督学习场景下存在的噪声分布未知且存在大量局外点的情况,拟采用基于熵准则的鲁棒度量针对特征学习方法及其相关其他拓展进行研究:(1)研究了非监督场景中,为了消除或抑制噪声和局外点的影响且充分利用在半监督场景中少量数据类别信息,研究并提出了一类基于熵准则度量及数据全局重构信息的鲁棒特征学习模型。(2)2在非监督场景中,为了增强特征学习的判别性和抑制噪声及局外点的影响,研究并提出了一类基于熵准则度量的自适应局部结构学习正则项。(3)由于基于熵准则度量的极度非凸性,研究一种对该模型进行求解的算法,该算法具有较好的收敛性和较低的计算复杂度。主要成果如下:(1)提出了一种基于最大相关熵准则(MCC)的半监督概念分解的方法,该方法采用MCC作为相似度度量来构建目标函数。为了结合数据的局部结构信息并消除局外点的影响,提出了一种基于MCC的自适应局部结构保持项,能够自适应的学习数据的局部结构。针对该模型提出了一种基于Fenchel Conjugate与加速块坐标更新的求解算法,并分析了其收敛性与复杂度。通过在4个公共数据库的对比实验验证了所提出方法在局外点处理的有效性。(2)在深度学习领域,结合Center Loss提出了一种基于相关熵准则的损失函数Correntropy Center Loss,并提出了一套基于深度学习的框架的mini-batch的方法来对深度网络进行求解。该模型主要用来处理脑电信号运用到运用想象中,通过不同算法对比,该方法取得了更好的运动想象识别率,特别是在数据库中存在有局外点的情况下。(3)提出了一种基于最大相关熵准则的低秩矩阵分解模型来处理半监督场景中的特征学习问题,该方法能够好的保持样本的全局重构信息,同时自适应的学习样本的局部结构关系来进行特征学习。通过在公共数据库上进行对比实验,改方法取得了较好的结果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

周楠的其他基金

批准号:51504238
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81703514
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:51874287
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:31700966
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:31700969
批准年份:2017
资助金额:22.00
项目类别:青年科学基金项目
批准号:71902091
批准年份:2019
资助金额:18.00
项目类别:青年科学基金项目
批准号:21901195
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:11602113
批准年份:2016
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

基于稀疏表示分类准则的领域适应特征学习方法研究

批准号:61806099
批准年份:2018
负责人:张国庆
学科分类:F0605
资助金额:27.00
项目类别:青年科学基金项目
2

基于自编码机的半监督特征表示学习方法研究

批准号:61906060
批准年份:2019
负责人:朱毅
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
3

有监督和半监督多视图特征学习方法与应用研究

批准号:61702280
批准年份:2017
负责人:吴飞
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
4

非监督深度哈希图像表示学习方法研究

批准号:61806220
批准年份:2018
负责人:李阳
学科分类:F0604
资助金额:21.00
项目类别:青年科学基金项目