基于热工过程实时数据的建模与知识发现是热能工程领域重要的应用基础问题,探索海量实时数据流处理的相关新理论、新方法也是数据挖掘领域最富挑战性的基础研究内容之一。针对热工过程实时数据流具有的海量、混杂、时序和高维等特点,本项目采用信息熵理论及方法对其进行信息度量和信息测度分析,研究实时数据流信息熵变化特征及其信息演化规律;分析系统特性参数及运行工况对实时数据流信息熵的影响作用,深入研究热工过程特性与信息熵及熵变间的影响关系,并建立基于信息熵特征数据的热工过程特性辨识方法;研究不同数据子集之间以及数据集叠加前后信息熵的变化关系,从测量数据信息分布的角度研究热工过程变量分类和系统降维问题,建立变尺度混合数据协调算法。本项目将阐明实时数据流信息分布与热工过程运行特性间的影响机制,得到海量实时数据流协调处理的新方法,为热工过程海量时序数据集的建模、挖掘与处理提供理论依据和技术手段。
热工过程实时数据流具有的海量、混杂、时序和高维等特点为该类数据流的分析建模和知识发现带来了极大的挑战。本项目采用信息熵理论及方法对热工过程海量实时数据流信息度量与演化规律、数据流聚类、数据协调及过程诊断方法进行了研究与分析。以数据流信息熵分析为基础建立了多特征高维数据信息熵计算模型,实现了数据流中多变量相关性分析和海量数据约简。建立了数据流在不同信息测度下的信息熵特征提取方法,实现了信号不同层次内在特征的有效描述和定量表征,进而建立了基于信息熵特征提取和PNN网络的锅炉燃烧工况识别模型。采用动力系统熵来定量表征热工系统状态的复杂程度,为热工过程非线性特性研究提供了一种新方法。提出了一种融合Shannon熵的类心自适应聚类算法,通过信息熵跃迁差值反映数据流中信息量的有序程度,并按照信息熵值作为聚类类心的选择依据,从而大大提高了算法的自适应能力。基于时序实时数据流演化过程中数据类心的连续变化特征,在多密度DBSCAN算法基础上引入网格聚类算法的思想及贡献度与迁移因子的概念,得到了适合与数据流聚类的GCMDDBSCAN算法。开发了新的数据协调神经元计算模型,通过模型参数的优化有效提高了算法对海量数据流数据协调的处理效率,在目标函数中增加影响因子函数和可靠性系数进一步增强了模型的鲁棒性,在神经元模型中增加机理约束条件则能同时兼顾参数间的拟合关系和热工过程的物理规律。以热工过程实时数据流分析理论与方法为基础,结合过程仿真与数值模拟数据,得到了锅炉燃烧、大型空冷塔、空预器等热工过程的诊断方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
空气电晕放电发展过程的特征发射光谱分析与放电识别
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
海量移动对象轨迹数据流实时分析算法研究
海量数据流实时分发技术研究
面向海量数据流处理的隐式世系跟踪容错方法研究
热工过程故障诊断方法研究