In modern Statistical Process Control (SPC), more and more real applications involve multiple categorical quality characteristics and each characteristic has two or more attribute levels, which can be displayed by a multi-way contingency table. In order to monitor the multi-way contingency table data, this project tries to work on the following three fields: 1) Developing some new monitoring methods for sparse contingency table by applying Group Lasso method into a log-linear model and proposing some new monitoring statistics; 2) Proposing some new multivariate ordinal categorical control charts for the multi-way contingency table data with ordinal categorical variables by incorporating the ordinal information into an extended log-linear model ; 3) Developing some new approaches for monitoring multivariate autocorrelated contingency table data by applying a high-order Markov chain or context-tree method into a log-linear model.
在现代统计过程控制中,越来越多的实际应用中包含多个属性变量,且每个属性变量包括两个或多个属性水平,这种多元属性数据经常用一个多维列联表来刻画。为了更好地监控多维列联表数据,本项目主要开展三个方面的研究:. 1)将Group Lasso方法应用到log-linear模型中去,提出一些新的统计量来构建稀疏列联表数据下的多元属性控制图;. 2)将变量的顺序信息应用到一个扩展的log-linear模型中去,对含有有序变量的列联表数据提出一些新的监控方案;. 3)基于高阶马氏链方法和背景树方法,发展一些观测值自相关时多维列联表数据下的控制图方案。
大数据时代,数据维数不仅越来越高,结构也越来越复杂。传统的适用于低维连续型数据的统计过程控制方法面临巨大的挑战。本项目主要致力于研究高维列联表数据、高维数据流、序列相关数据等复杂数据的监控。主要研究内容和重要结果如下:. (1)采用log-linear模型和Group Lasso方法相结合来刻画高维稀疏列联表数据的概率分布,理论上证明了这种估计的优良性,并构造了在稀疏列联表下同样高效的监控统计量,填补了稀疏列联表数据监控方法上的空白;. (2) 将高维数据流的方向诊断问题视作一个多重方向检验问题,分别从控制总误报率以及各个方向上的误报率两个角度,研究使得正确识别的平均数目达到最大的最优方案,然后利用这种方法构建了一套行之有效的诊断方案,将加权漏检率控制在一个满意的水平;. (3)当数据间具有相关性时,本项目尝试引入了一个相关弹簧长度的定义,通过使用距当前时间点相差一定弹簧长度内的观察值而忽略所有距当前时间点超出弹簧长度的历史观察值来构建一个新的累计和控制图;. (4)基于可以同时检验两样本均值-方差的Cucconi统计量,针对不同的均值和方差漂移,引入一个权重函数自适应地选择权重,构建了一个同时监控均值和方差的不依赖于分布的指数加权移动平均控制图;. (5)针对带有跳跃点的剖面数据,首先利用跳回归分析技术构建一套检测跳点的方案,当跳点检测出来以后,再构建一种新的逐段剖面登记方案来消除阶段变异性,最后将跳点信息、登记的逐段剖面信息结合起来构造指数加权移动平均控制图来进行监控。 . 上述成果中的数值模拟和实例分析均表明所构建方法的有效性和实用性,可广泛应用于制造业、服务业、金融业、生物医学、流行病学、以及其他自然和社会科学领域中的质量监控。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
黄河流域水资源利用时空演变特征及驱动要素
基于LASSO-SVMR模型城市生活需水量的预测
中国参与全球价值链的环境效应分析
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
生物医学研究中列联表数据在逆抽样条件下的统计推断
基于数据多维属性的低能耗数据分布策略研究
黑河流域关键土壤属性数字制图研究
基于属性偏序模式发现原理的多维混合数据模式分类研究