With the rapid development and wide applications of modern information and sensoring technology, many industries are generating and storing large amounts of data at every moment. How to perform surveillance and make further decisions on a real-time basis based on these data will have a significant social and economic impact. On one hand, due to different nature of many industries, data may have complex forms and various types. On the other hand, very short sampling intervals and high sampling frequencies lead to temporal autocorrelation among data. Besides, many data are repeated measurements of some characteristics of individuals or populations as time goes on, and naturally temporal autocorrelation exists among them. Therefore, various types and temporal autocorrelation bring two major challenges for data modeling, analysis, and surveillance. This project aims to propose a methodology of monitoring various types of autocorrelated data on a real-time basis and with high efficiency. To be specific, this project will consider the following types of autocorrelated data: continuous data, binomial and multinomial data, ordinal categorical data, and count data with constant and time-varying population sizes. The developed methods will efficiently and flexibly monitor averages or expectations of various types of data as well as autocorrelation structures such as autocorrelation coefficients and orders. Furthermore, these methods will provide important references and guidelines for real-time surveillance and timely decisions in many industries that face the challenge of huge amounts of data generated rapidly.
随着现代信息和传感技术的迅猛发展和普及应用,很多行业每时每刻都会产生并存储大量的数据。如何利用这些数据实时监控并及时做出决策具有重要的社会和经济意义。一方面,由于行业性质不同,产生的数据形式复杂种类繁多。另一方面,由于采样间隔短、频率高,数据通常带有时间上的自相关性。此外,很多数据是关于单个个体或总体的某些特征随时间变化的重复性测量,它们本身就有自相关性。可见,数据的繁杂种类和时间自相关性为其建模、分析和监控带来了两大挑战。本项目旨在提出一套可有效实时监控时间自相关的多种类别数据的方法。具体来说,本项目将考虑以下时间自相关的数据类别:连续数据、二项和多项的名义分类数据、有序分类数据,以及总体大小恒定和时变的计数数据。开发出的方法可有效且灵活的监控各种数据的均值或期望,以及自相关系数和阶次等结构性参数,从而为当前面临海量数据快速生成挑战的多种行业的实时监控和及时决策提供重要的参考和指导。
本项目研究了时间自相关或多元的各种基本数据类型的质量特性的统计监控,着眼于开发出能够及时检测过程异常的方法。由于很多实际应用中采样间隔短、频率高,数据往往表现出自相关性,这种特性在质量控制中必须加以考虑和适当利用才可提高监控功效。本项目采用多元分布的视角来研究自相关数据,比文献里基于回归分析或时间序列模型的方法更为有效。在这个意义上,多元数据的监控也是自相关数据监控的基础。首先,对非正态的多元连续数据,考虑更为一般化的椭圆方向分布,建立起检测均值稀疏性变化的稳健方法,为后续非正态的自相关连续数据的稳健监控提供了基础。第二,多元分类数据分为多元名义分类和多元有序分类数据,分别从相关性和因果关系两个角度出发,建立起相应的有效实时监控方法。第三,对时间自相关的分类数据和计数数据,基于多元分布分别对自相关名义分类数据、自相关有序分类数据和自相关计数数据开发出了统计监控策略,能够全面监控数据的边缘分布和自相关结构。第四,对同时包含连续数据和有序分类数据的混合型数据,直接绕过复杂的建模,利用标准秩建立了简洁的方法,能高效监控连续数据和有序分类数据潜变量的联合分布。.长期以来,统计质量控制的文献集中在多元和自相关的正态分布数据,对非正态的连续数据以及分类数据、计数数据则考虑不足。本项目考虑了统计质量控制中若干基本问题,提出的方法能抓住所关注数据的本质和特征,因而监控效率高。这些方法及时填补了研究空白,是对统计质量控制方法论的完善,也为实际应用中的质量控制提供了有力工具。在项目支持下,课题组共计发表SCI论文10篇,已录用待发表SCI论文3篇,发表会议论文1篇,此外还有若干篇论文在期刊审稿。发表论文的期刊包括美国质量协会旗舰期刊Journal of Quality Technology,工业和系统工程师协会旗舰期刊IISE Transactions,以及工业工程领域的知名期刊International Journal of Production Research和Computers & Industrial Engineering。以上论文均标注了国家自然科学基金资助和本项目批准号。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于被动变阻尼装置高层结构风振控制效果对比分析
基于改进LinkNet的寒旱区遥感图像河流识别方法
智能煤矿建设路线与工程实践
氧化应激与自噬
新产品脱销等待时间对顾客抱怨行为的影响:基于有调节的双中介模型
基于复杂轮廓数据的统计建模和在线监控研究
应用于复杂数据的统计监控和诊断
一些复杂数据的统计过程监控与诊断
若干复杂纵向数据模型的统计推断