征兆属性不完备、类不平衡以及高维小样本是复杂机电系统状态监测信号的重要特征。属性不完备造成有效信息丢失,类不平衡导致分类器偏好,高维小样本增加学习的复杂性,这些问题成为限制机械设备运行状态识别技术发展的瓶颈问题。本项目基于仿生模式识别关于同类样本的渐变思想,研究最小生成树覆盖算法描述样本空间分布特性,以最佳覆盖为目标,消除类数量不平衡对识别性能的影响,并完成边界样本内不完备数据的填补。根据样本分布的覆盖特性(如单一覆盖、重叠覆盖、交叉覆盖),对复杂的样本分布进行任务自动分解,采用集成学习方法实现状态自动识别。主要研究内容包括:边界样本的自适应确定、基于仿生模式识别的不完备不平衡数据的处理方法、高维小样本数据降维技术以及集成学习方法的研究。本项目瞄准国际前沿与技术难点,对故障诊断、智能识别、数据挖掘等相关领域具有重要的学术研究意义和工程应用价值。
征兆属性不完备,类不平衡以及高维小样本是复杂机电系统状态监测信号的重要特征。针对故障诊断中出现的数据属性丢失、不完全或无法确定导致的数据信息残缺现象,研究了回归填补、最大期望(EM)填补、以及基于马尔科夫链(MCMC)的多重填补法,结果表明在缺失率较低时,回归填补法填充后的数据更接近原始数据;但在数据缺失率高时,基于马尔科夫链的多重填补法表现优越。由于故障诊断中正常信号往往多于故障信号,对于这类不平衡数据,研究了k近邻聚类算法和仿生模式识别算法,实现了超香肠神经元网络算法和双权值神经网络算法,结果表明仿生模式识别方法比传统模式识别效果好。对高维小样本数据,研究了主分量分析(PCA)、线性判别分析(LDA)、核主分量分析(KPCA)、非负矩阵分解(NMF)几种降维方法,通过对人脸图像的降维和降维后数据的图像重构,以重构图像与原始图像的吻合度来比较几种降维方法的有效性,结果表明,非负矩阵分解降维方法效果最好。最后对Sugeno和Choquet经典模糊积分进行了探讨,对其中关键函数模糊密度的确定进行了研究,因为模糊密度决定了分类器自身对融合系统重要性,并且由此导出的模糊测度又决定了分类器任意组合对融合系统的重要程度,结果表明分类器关于每个类别的正确率,以及由正确率、可分辨度和描述品质共同确定模糊密度的方法效果最好。同时,将两种模糊积分集成学习分别用于相同类型和不同类型的学习机器决策进行决策融合,结果表明,不同类型学习机器由于各有所长,其决策融合效果优于相同类型的学习机器。本课题涉及了3种不同类型的数据难题,这3类难题恰又是工程中实际存在且一直以来难以攻破,所以本课题的研究尽管目前取得的成果有限,但此方向课题的研究对于故障诊断、智能识别、数据挖掘等相关领域具有重要的学术研究意义和工程应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制
基于分形维数和支持向量机的串联电弧故障诊断方法
高维不平衡数据的集成学习算法研究
面向高维小样本数据的集成分类方法研究
基于半监督集成学习的不平衡数据研究
基于集成学习的不平衡流数据分类问题研究