非负矩阵分解中维数约简问题的研究

基本信息
批准号:61373001
项目类别:面上项目
资助金额:58.00
负责人:赵金熙
学科分类:
依托单位:南京大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:申富饶,范红军,邢佑路,竺涛,徐国强,唐泽林,陈文雍,张仁,胡孟
关键词:
非负矩阵分解高维数据集增量学习非负特征表示维数约简
结项摘要

The feature represents of high demension negative data set is the core task in the field of pattern recognition, machine learning and image processing.Non-negative matrix factorization ( NMF ) is an effective technique for feature representation and low rank approximation.Dimension reduction factor r in NMF directly affect the calculation results of decomposition, such as r is too large, form data redundancy to increase the computational effort and memory space; r is too small, then the loss of useful information and influence the effect of NMF approximation. But the NMF algorithm almost all need to be given the value of r in advance, is an important problem which is in NMF. This project from a new point of view, the discussion and Research on the characteristics for a special cone will be formed by the data space. According to our research group in this work accumulation, and determine the value of r in the basis matrix W process, then have nonnegative constraints or non negative sparse constrained least square model, by the optimization method obtained coefficient matrix H. We will present the improved NMF method ( INMF ) and NMF method ( SNMF ). The algorithm framework without the given r value in advance, the problem is converted into a low order convex problem, avoid NP-hard difficult.The workload is reduced obviously, and the preliminary simulation results show the effectiveness of the new algorithm and the dimensionality advantage.

高维非负数据集的特征表示是模式识别、机器学习和图像处理等研究领域的核心课题,非负矩阵分解(NMF)是特征表示和低秩逼近的有效技术。NMF中的维数约简因子r 是直接影响特征表示的重要指标:如r取得过大,就加大计算工作量和存储空间;r取得太小,就丢失有用的信息而影响NMF的逼近效果。但目前几乎所有的NMF类算法都需要事先给定r的值,如何自适应得到r的值就成为NMF中具有挑战性的重要课题。本项目创新性地从讨论和研究数据空间形成的特殊锥(cone)的特性入手,依据我们课题组多年的工作积累,在构造基底矩阵W的同时确定r的值,然后通过解非负约束或非负稀疏约束最小二乘模型,通过最优化方法求得编码矩阵H。提出了改进NMF方法(INMF)和半NMF方法(SNMF)。该算法框架无需事先给定r的值,将问题转化为一个低阶凸问题,避免了NP-hard的困难,计算工作量明显减少,初步模拟结果体现了新算法的有效性

项目摘要

该项目抓住非负矩阵分解中高维数据“降维”这个核心问题进行了深入的研究。在该基金的支持下,我们利用向量系的数值相关性理论等工具,构造数值稳定的计算方法。并将我们的研究成果应用于神经计算方面,得到了一些有意义的结果。主要包括(1)我们提出了名为正交成分分析(orthogonal component analysis,OCA)的快速线性降维算法。OCA主要用于实现两大目标:低计算复杂度的线性降维,以及自动的目标维数确定。OCA在计算过程中无需求解特征值问题或矩阵求逆问题,以Gram-Schmite正交化过程为基础进行特征空间正交基底的提取,因此保证了较低的计算复杂度。(2)增量式正交分量分析IOCA。形成快速而有效地从高维数据中提取有用信息的方法。作为一种重要的降维技术在机器学习、数据挖掘等领域得到应用。(3)提出一种新型神经网络——感知进化神经网络。目前已有的非监督学习算法中,所有数据输入都有着固定的数据维度。而在真实的学习环境中,一个新的感知通道的数据时常会产生,这是一种在线自组织增量学习神经网络,相比于传统无监督机器学习算法,其由多方面优势。(4)提出了一种基于局部分布学习的自组织增量学习神经网络:局部分布自组织增量学习神经网络(LD-SOINN)。其采用局部的距离矩阵学习和自适应的在线更新策略,从而更好地适应动态变化的数据环境;能够合并相邻并具有相似主成分的神经元节点,使得生成的网络结构更加简洁有效。.在项目资助下,共计发表论文25篇,包括神经网络领域著名国际刊物<IEEE Trans. On Neural Networks and Learning System>(影响因子6.108)、<Neural Networks>(影响因子5.287)、<Neurocomputing>(影响因子3.317)和顶级国际会议IJCAI、知名国际会议IJCNN、ICPR、ICONIP等。发表文章中SCI收录5篇,EI收录25篇。申请国家发明专利7项,其中获授权4项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

赵金熙的其他基金

相似国自然基金

1

面向高维数据挖掘的非负矩阵分解关键问题研究

批准号:61375062
批准年份:2013
负责人:景丽萍
学科分类:F0603
资助金额:80.00
项目类别:面上项目
2

非负矩阵集分解研究

批准号:60872084
批准年份:2008
负责人:章毓晋
学科分类:F0116
资助金额:30.00
项目类别:面上项目
3

面向高维信息的非线性维数约简问题研究

批准号:61303091
批准年份:2013
负责人:高小方
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
4

两类特殊非负矩阵分解问题的黎曼优化方法研究

批准号:11601112
批准年份:2016
负责人:赵志
学科分类:A0502
资助金额:18.00
项目类别:青年科学基金项目