As one main method of statistical inference, multiple comparison procedures, which are used to compare diffence of different groups, have long been important techniques in the research of many disciplines including medical science, psychology and social sciences. However there are shortage of rigorous statistical theory and methods for multiple comparisons with ordered categorical data. The method of latent variable model that conceptualizes the ordinal responses as manifestations of some underlying continuous variable is used to conduct multiple comparisons with ordinal data. In this project, we will discuss multiple comparisons with a control in families with both one-sided and two-sided hypotheses for a latent variable model with ordinal data, and sample size determination to satisfy the power requirement will be discussed. Also, some new methods, such as kernel estimation technique and Bootstrp, are proposed to handle the cases of small sample size, which will make multiple comparisons fail to control the family-wise error rate. Further, Bayes will be applied to conduct multiple comparisons with ordinal data, which is also an important problem in this project.
作为统计推断的一种主要形式,多重比较被用来检验多组独立样本的差异性,在医学、心理学、社会学等各个学科中均有广泛的应用,然而对有序分类数据的多重比较问题的研究还缺乏严谨的统计理论和方法。潜变量模型方法把有序分类响应变量看作是某个连续随机变量的一个实现,它已经被应用于构造具有有序分类数据的多重比较过程中。本项目将会基于潜变量模型对有序分类数据的混合单边和双边检验的多重比较过程进行讨论,并确定满足一定功效的最优样本量;同时,将对小样本情况下引起的无法控制多重比较过程的整体一类误差的情况进行讨论,提出新的解决方法,如核密度估计技术和Bootstrap方法。最后,基于Bayes方法对具有有序分类响应变量的多重比较问题的研究也是本课题的一个重要研究内容。
本项目主要研究了基于潜变量模型如正态分布模型对有序分类数据的多重比较问题。有序分类数据作为常见的数据类型,其统计分析方法还比较有限。本项目着眼于对有序分类数据进行多重比较分析,这种方法是在医学、心理学和社会学中被普遍应用的分析方法。已有的文献采用的方法包括秩和检验法和潜变量模型法。然而,秩和检验法存在一个问题,即它的有效性只在不同组的样本数据具有相同分散性的假定下才成立。因此,潜变量模型法就成为了一个较佳的选择,其最常用的潜变量模型是logistic模型和正态分布模型,基于logistic模型的研究一般都假定不同组的样本数据具有已知或是相同的方差,然而,现实的数据很难以满足这样的模型假定。本项目致力于研究基于潜变量模型如正态分布模型来解决有序分类数据的多重比较问题。多重比较问题经常涉及到比较多个实验组与一个控制组和实验组的两两比较问题。已有文献对这两种多重比较问题进行了讨论,但都是对于单向设计进行讨论。本项目在双向设计实验下基于潜变量模型对有序分类数据的一个控制组与多个实验组的两两多重比较问题进行讨论,也基于潜变量模型对混合单边和双边检验的多重比较问题进行了讨论,并把这些多重检验过程应用于实际医学数据中,从而丰富了对于有序分类数据的统计研究方法,同时给研究人员提供了实验设计过程中所关心的具体的检验步骤和程序代码,具有很好的实际应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
带潜变量高维模型的统计推断
海量数据下回归模型的变量选择及统计推断研究
关于有序数据的统计推断
纵向数据线性混合效应模型的统计推断及其变量选择