The massive samples and high-dimensional features of big data bring abundant information. However, the severe missingness in data acquisition , data transmission and data storage, significantly degrades the data quality and usability. Missing data break the basic assumption that data are complete for machine learning, and make the existing models fail. In this project, we take equipment fault diagnosis as example, discuss the representation way of missing data, investigate the influence mechanism of missing data on machine learning models, and develop missingness robust learning models and algorithms. The research of this project will result in the following innovative achievements: (1) For large-scale machine learning, we will establish the influence mechanism of missing data on machine learning models based on influence function. (2) We will develop missingness robust learning models based on error modelling and curriculum learning. (3) We will design missingness robust loss functions for deep learning and latent space based deep learning models robust to multiple missing types. (4) The research results are applied to the modeling of equipment fault diagnosis and high diagnosis performance is obtained.
大数据中的海量样本和高维属性带来了丰富的信息,但在数据采集、传输和存储过程中存在的严重数据缺失降低了数据质量和可用性。数据缺失破坏了传统机器学习模型对数据完备性的基本假设,使得学习模型无法适用或性能下降。本课题以大型动力设备故障预测为应用示范,讨论机制感知的数据缺失表示方法,探索数据缺失对机器学习模型的影响机制,设计大规模缺失数据的鲁棒学习模型和算法,系统研究缺失数据的学习问题。本项目的研究将形成如下创新性成果:(1)建立基于影响函数的数据缺失对学习模型的影响机制;(2)提出基于误差建模和课程学习的缺失鲁棒学习模型;(3)设计缺失鲁棒的深度学习模型损失函数和基于隐空间的多种缺失鲁棒的深度学习框架;(4)将研究成果应用于故障预测,获得高性能的故障预测模型。
大数据中的海量样本和高维属性带来了丰富的信息,但在数据采集、传输和存储过程中存在的严重数据缺失降低了数据质量和可用性。数据缺失破坏了传统机器学习模型对数据完备性的基本假设,使得学习模型无法适用或性能下降。本课题以搭载多传感器的无人机对地态势感知为示范场景,构建大规模缺失数据平台,设计大规模缺失数据的鲁棒学习模型和算法,并在实际场景中展开应用验证,系统研究缺失数据的学习问题,形成了如下创新性成果:.(1)构建了面向无人机环境感知的大规模多源多模态非完备数据平台。针对全天候目标计数任务,构建了双光人群计数数据集DroneRGBT并提出了可生成缺失模态数据的双光计数模型;针对全天候目标检测任务,构建了基于无人机的多模态车辆检测数据集DroneVehicle,并提出了一种不确定性感知的跨模态车辆检测方法。.(2)设计了面向缺失模态生成的生成对抗学习框架。提出了多模态图像合成的基于自编码器的协同注意力生成对抗网络,该网络可以利用任意数量现有模态合成缺失模态;提出了基于多视图知识集成和频率一致性的人像翻译框架,该框架可以在人脸的不同模态之间进行互相生成,包括照片和素描,照片和线条画等。.(3)提出了面向任意视图缺失的表示学习方法。提出了基于集成异构图注意力网络的缺失多视图聚类方法,能够同时捕获视图内和视图间的局部数据结构;提出了基于隐空间异构图的缺失视图表征方法,该方法在不同视图缺失率下都表现出了优异的结果。.(4)开发了感知对象缺失的任务驱动多模态学习方法及应用。设计了一种检测驱动的红外和可见光图像融合网络,该网络在目标信息缺失时,使用目标检测网络为融合网络补充目标相关的关注信息来指导融合的特征细化,并为图像融合网络提供检测驱动的优化。开发了嵌入该算法的智能无人机巡检平台,用于交通巡检和电力巡检等任务中。.受该项目资助,共计发表CCF A和IEEE汇刊论文21篇,研究成果可应用于军事安防、智慧城市、智慧交通等领域,带来了一定的社会和经济价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
拥堵路网交通流均衡分配模型
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
五轴联动机床几何误差一次装卡测量方法
面向鲁棒目标跟踪的小样本数据下CNN模型学习方法研究
不确定环境下鲁棒网络设计优化模型的研究及应用
基于稀疏优化的鲁棒多示例学习方法研究
开放数据环境下技术专家定位与评估方法研究