Due to the requirement of the plant-wide process monitoring and the diversity of the sampling period in multivariable system, the data show a huge momentum, some variables in sampling point appear periodically missing. How to address the distributed plant-wide process monitoring using these massive information with missing data, is an important and challenging issue in control area. In this project, missing data is estimated by Bayesian inference and then the plant-level distributed submodules are established based on Copula correlation analysis. For the shortage of labeled samples in massive data and the difficulty of shallow analysis to extract data features effectively, Adaboost is used for expansion of labeled data, and stacked denoising autoencoders is adopted for the deep features extraction of a single submodel. On this basis, the deep features of the plant-wide process are extracted by migration learning. After feature abstraction, aiming at the class imbalance of feature samples and the limitation that the industrial process conditions is determined only by the current characteristics of the process, through cost matrix, a feedback based dynamic recurrent deep network is designed. By utilizing the features in current time as well as the hidden variables of the system's working conditions in historical moment, the time-varying and status of the process are analyzed. After that, under the help of the decision-level probability fusion, the deep information mining based dynamic plant-wide process monitoring is achieved.
随着工业全流程监控的需求和采样周期的多样性,过程数据呈现海量态势,采样点中部分变量出现周期性数据缺失。如何利用这些海量带缺信息进行监控,是过程控制领域面临的具有重要价值和挑战性的课题。本项目针对海量带缺数据,拟通过贝叶斯推理估计非完整采样中缺失数据的真值,继而利用该估计值实现基于Copula相关分析的全流程系统分布式子模块构建。针对海量数据中标记样本不足和浅层分析方法难以有效提取数据特征的问题,进行Adaboost标记样本扩充,并采用堆栈式去噪自编码器深度网络提取单一子模块的深层特征,在此基础上通过迁移学习实现全流程深层特征的提取。针对特征样本类别不平衡和静态监控算法难以捕捉过程动态特性的局限,通过代价矩阵,设计基于反馈的动态循环深度网络,利用历史时刻反映系统工况的隐变量以及当前时刻的特征,分析各子模块的时变性和状态,并通过基于概率的决策层融合,实现基于深度信息挖掘的动态全流程监控。
随着集散控制系统的发展,大量数据得以采集,据此建立基于数据的监控系统,及时检测故障的发生。但是,现代工业全流程监控的对象特性及系统的实现结构远远超出已有基于数据的过程监控系统设计方法的适用范围,对工业过程监控提出了新的挑战。因此,本研究针对全流程多采样率系统,利用数据估计和增强方法,基于深度特征提取和迁移技术,分布式动态挖掘过程特征,实现现代复杂工业过程监控。首先,由于多变量系统的采样周期不一致,影响监控的时效性和准确度,因此,研究基于强化移动窗贝叶斯算法的多采样率全流程过程真值估计及故障诊断策略,估计多采样率系统中缺失部分的可能实现。其次,为了捕捉海量分散数据的复杂特性,如监控点多、耦合度强和时滞大等,基于可以同时描述变量之间相关程度和相关模式的copula函数,本研究提出基于加权copula相关性分析的全流程过程分布式监控策略,通过基于copula相关分析的加权策略而非截止参数来获得每个子块中的变量,避免了信息丢失,并防止了“噪声”信息的干扰。此外,本研究还应用复杂网络原理,将全流程工业过程数据利用可视化的图拓扑结构进行分块与监控。再次,考虑到全流程监控数据的维数、关系复杂程度和数量呈现爆炸性增长,浅层特征提取方法难以有效提取数据特征。而且工业过程通常是动态的,很少有标记的故障数据。所以,本研究提出了基于迁移学习和动态特征提取的结合自动编码器与门控循环单元的新策略,以及基于深度域自适应和迁移局部特征学习的堆栈式自编码器的跨任务故障诊断方法。最后,复杂过程还具有随时间连续演化的特性,其当前时刻采样值与历史时刻相关。为了提取序列数据的动态特征,本研究提出了一种基于改进GRU神经网络的工业自相关数据故障诊断方法。综上所述,本项目融合了海量数据的分布式处理、非完整数据的真值估计、特征的深层抽象以及过程的动态监控,实现了基于动态深度信息挖掘的海量全流程数据分布式监控策略研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于全模式全聚焦方法的裂纹超声成像定量检测
结核性胸膜炎分子及生化免疫学诊断研究进展
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
数据驱动的海量遥感影像高效信息挖掘
基于深度学习的海量影像文本报告与医学图像复合信息挖掘
海量土应力应变试验数据深度挖掘与本构关系
基于云计算的海量数据挖掘