This research is mainly focus on a large amount of data dimensionality reduction and statistical model accuracy improvement for data driven fault diagnosis in batch process. It is proposed that the data in high dimension is relevance to Markov neighbor random walk and the weighted distant based degree of approximation between any data is gained. By data diffusion maps, the distant statistic maximum information is reserved and manifold features in data low dimension is gained, and data in low dimension is extracted based relevant data transition probability diffusion maps, then this is called data intrinsic dimension. The data intrinsic dimension is a minimum dimension that optimally preserve data original information and reduce the data redundancy and enhance data memory size and calculating speed. k-nearest-neighbor in data intrinsic dimension is based not only sparse distributed and degree of relevant and approximation but also extracting data density diffusion kernel and local characteristic relationship and distributed geometrical features in diffusion random walk, then diffusion distant in data intrinsic dimension is gained and used in fault diagnosis based k-nearest-neighbor. These theories and methods will be applied into fom fermentation batch process in Northeast Pharmaceutical Group, then product quality and safety and reliability will be improved.
本项目主要研究间歇过程数据驱动故障诊断中的海量数据的降维处理和数据统计模型准确.性的提高问题。提出将高维空间数据建立与之对应的Markov随机游走邻近关联,得到任意数据点之间近似度的一种加权距离,通过数据的扩散映射最大化保留扩散距离统计量信息并获取数据的低维流形特征,提取关联数据空间转移概率扩散映射下的低维数据空间,即数据的本征维度空间。数据本征维度是最大化保留数据空间信息的最小维度,降低了数据的冗余度,提高了数据存储量和计算速度。本征维度空间的k近邻考虑数据间的稀疏分布和数据近邻的关联度和相似度,同时在数据扩散游走过程中,提取数据点密度扩散核,建立数据局部特征关系、捕捉数据局部几何特性,得到本征维度空间下的数据间的扩散距离,将扩散距离作为k近邻统计分布的标定距离进行故障诊断。上述方法将应用于东北制药集团的磷霉素发酵间歇生产过程进行验证实验,可进一步提高产品质量和生产的安全性与可靠性。
项目针对间歇生产过程的海量过程采集数据,以及数据具有的多模态、多阶段、多工况、三维性等数据特点,进行数据预前处理、统计分析、数据建模,实现过程的监视、故障诊断与安全监控。主要通过基于局部近邻标准化的FD-KNN故障检测、基于动态多向局部离群因子的在线故障检测、基于双近邻标准化的多阶段过程数据扩散映射中心化预处理、过程独立元潜隐变量的k近邻故障检测、基于判别核主元空间k近邻的间歇过程监视、基于密度标准误差的局部保持投影故障检测策略、基于主元分析得分重构差分的故障检测策略、基于LPP-WkNN的多模态间歇过程故障检测策略的研究。实现了间歇过程多模态、多阶段、多工况数据存储量的减小及计算速度的提升,完成了在数据本征维度空间建立过程的统计模型,使间歇过程在数据最小维度空间进行故障诊断,有效地提高了过程监视与安全监控的性能。通过大量的过程实践与应用验证了理论的可行性、算法的有效性以及结果的准确性。项目通过对间歇过程本身的数据三维性、不规整、非高斯、互关联等数据特性的研究,以及非线性、多模态、多阶段、多工况等间歇过程特性的研究,对数据间的关联性、稀疏性、相似性,进行样本的重新组合、替代、剔除等处理,搜索数据样本的本征维度空间,以及数据扩散与映射的空间,保证数据信息完整性的同时使数据量减少,维数减少、存储空间减少,提高故障诊断的计算速度、运行效率,基于数据的统计分析的实时性得到提高,是本项目的重要研究成果。项目将计算机技术、控制技术、网络技术与通讯技术不断融合、交叉、协同,基于过程的大数据进行过程状态的分析、处理、判断与决策,不断提高生产过程的信息化、智能化与系统化,不断提高对生产过程大数据的处理能力,使得基于数据的生产过程监视与故障诊断能力大大加强,对于保证化工间歇过程生产的安全可靠运行和不断提高产品质量,提高过程控制、过程监视与故障诊断的理论与应用水平具有重要意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
Protective effect of Schisandra chinensis lignans on hypoxia-induced PC12 cells and signal transduction
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究
路网中空间关键字(连续)k近邻查询算法研究
量子本征值问题实空间方法研究
数据广播环境下路网中连续(反向)k-近邻查询处理研究
基于多元统计方法的间歇过程监控与故障诊断研究