面对大量高维观察数据,很多方法都存在不可逾越的维数灾难。流形学习能够发现这些高维观察数据中有意义的低维嵌入流形,因而成为研究这类数据的有效方法,是目前的研究热点。但流形学习还基本处于理论探讨阶段,大多数研究是应用驱动的,学习性能还存在问题,需要理论和方法上的创新。事实上流形学习的效果依赖于人类的评价,其有效性需要符合人类的认知规律,而现在的很多方法没有这种考虑,例如人类比较容易处理噪音和小样本问题,现在的流形学习方法却很难处理。原因在于认知科学和心理学中的很多成果在机器学习中并没有用到。本立项的目的是利用数学架起认知科学与机器学习之间的桥梁,建立认知规律的几何模型,特别是建立认知的相对性和认知不变性规律的几何模型,然后用于数据变换,为流形学习提供优质数据,间接提高流形学习性能。另一方面直接用认知规律的几何模型建立新的流形学习方法,解决目前流形学习方法所面临的困难。
面对大量高维观察数据,很多方法都存在不可逾越的维数灾难。机器学习特别是流形学习能够发现这些高维观察数据中有意义的低维嵌入流形,因而成为研究这类数据的有效方法,是目前的研究热点。但流形学习还基本处于理论探讨阶段,需要理论和方法上的创新。例如流形学习方法对数据噪声和数据稀疏十分敏感,原因在于它们容易产生扭曲的邻域结构。现有方法试图将噪音点删除,但困难的是噪音难以准确识别,有些看起来是噪音的数据对数据分析来说是不可少的,如孤立点挖掘,而对数据稀疏性的处理则更缺少有效的方法。这些困难来源于认知科学和心理学中的很多成果在机器学习中并没有用到,例如人类比较容易处理噪音和小样本问题,现在的流形学习方法却很难处理。本项目利用数学架起认知科学与机器学习之间的桥梁,建立认知规律的几何模型,进而用于流形学习及数据挖掘,解决目前流形学习方法及数据挖掘所面临的困难。.项目主要研究了认知科学和心理学中的典型认知规律,如格式塔(Gestalt)心理学中的若干格式塔规律。第2研究了认知相对性规律及其几何模型, 以及演绎出的新机器学习方法。第3研究了认知不变性规律及其几何模型,包括几何模型, 具体的拓扑变换方法及变换条件等。第4研究了格式塔规律如对称性规律的几何化问题, 并应用于分类算法。第5研究了认知规律可能的应用领域, 包括机器学习/流形学习,数据挖掘,生物信息学,认知信息学,这些领域可以检验认知规律几何化方法的有效性。.项目的研究成果包括提出了几种认知规律的几何模型及其应用,提出了新的半监督流形学习算法,新的半监督分类算法,基于规则的最近邻分类算法,新的证据推理分类框架及其分类算法,新的聚类算法等, 这些成果共发表了论文28篇, 其中有2篇论文发表在计算机学会确定的A类顶级国际会议, 另有1篇发表在计算机学会确定的B类权威国际会议, 发表国际期刊论文9篇,另有1篇已被录用。整体上SCI收录9篇论文,EI收录17篇论文。项目结题后将继续在理论上采用微分拓扑、模糊拓扑等数学方法研究更多认知规律的几何化问题,并应用于机器学习与数据挖掘。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析
中国参与全球价值链的环境效应分析
流形学习与几何数据分析
基于流形学习和辛几何的安全云挖掘中若干数学问题的研究
多粒度流形学习及其在视认知计算中的研究
Kahler流形及子流形的几何