Latent variables have been widely encountered in many fields of science. Structural equation model (SEM) is a kind of very common and important latent variable model (LVM). However, for most SEMs, almost all existing statistical methods and commonly used software are developed through a parametric approach on the basis of a crucial assumption that the distribution of the latent variables is normal. Thus, they produce bias results for situations with non-normal and missing data. As missing data and non-normal data that included but not limited to highly skewed data, heavy-tailed data, and/or heterogeneous data are very common in substantive research, this problem represents an important and hot research topic in statistics, and/or social and psychological methods. The main objective of this project is to adequately address the above problem from both theoretical and practical perspectives. Our goals are: (1) To develop a novel semi-parametric nonlinear SEM with covariates in which the latent variables are modeled by a general nonparametric distribution so that it can be effectively cope with various kinds of non-normal and missing data. (2) To develop rigorous statistical methods for estimation of the proposed semi-parametric model for obtaining estimates of the latent variables and estimates of the parameters in the semi-parametric components, as well as parameters in the measurement and structural equations of the proposed SEMs. (3) To obtain general results for the difficult issue about model comparison in the context of general semi-parametric SEMs. We will develop efficient and dependable computer programs for producing the statistical results, and putting these programs onto a web-site for general use. In conclusion, the novel semi-parametric model and the newly developed Bayesian methods and computer programs will greatly enhance the applicability of SEMs to medicine, management, social and psychological research.
结构方程模型是一类常见且重要的潜在变量模型。在以往的研究中,多数的统计方法都假定数据服从正态分布,但它们在处理非正态及缺失数据时会出现较大偏差。缺失数据以及包含偏斜数据、重尾数据和异构数据的非正态数据广泛存在于各个领域中,包含此类数据的结构方程模型目前已成为统计学、社会学和心理学等学科研究中的一个热点问题。本项目拟研究的内容如下:(1) 建立新的半参数结构方程模型,有效处理各种类型的非正态及缺失数据;(2) 采用贝叶斯统计方法对所提出的半参数模型进行参数及潜在变量的估计;(3) 在半参数结构方程模型框架下,进一步探索改进模型选择的方法。在理论研究的同时,我们也将适时开发并公布相应的程序。预期研究结果有望拓展和改进目前文献中已有的研究结果,并推动结构方程模型在医学、管理学、社会学和心理学等诸多学科的应用。
结构方程模型是一类常见且重要的潜在变量模型。在以往的研究中,多数的统计方法都假定数据服从正态分布,但它们在处理非正态及缺失数据时会出现较大偏差。缺失数据以及包含偏斜数据、重尾数据和异构数据的非正态数据广泛存在于各个领域中,包含此类数据的结构方程模型目前已成为统计学、社会学和心理学等学科研究中的一个热点问题。本项目基本完成了如下研究目标:(1) 建立新的半参数结构方程模型,有效处理各种类型的非正态及缺失数据;(2) 采用贝叶斯统计方法对所提出的半参数模型进行参数及潜在变量的估计;(3) 在半参数结构方程模型框架下,进一步探索改进模型选择的方法。在理论研究的同时,我们编写了相应的程序。.我们的工作取得了一系列的成果。我们提出新的转移结构方程模型,考虑了数据缺失机制,综合采用非参数技术和贝叶斯方法等处理含有非正态及缺失数据的数据集,并将此方法应用于人们的工作满意度、生活条件和工作态度等潜在变量关系的研究中。我们还提出了新的转移潜在变量模型分析多维的非正态删失数据,将此方法应用于心血管疾病数据分析中。我们提出了一种具有相关先验的Probit回归模型,应用于白血病数据分析中。我们改进了高维数据分类时的变量选择方法,应用于结肠癌和白血病等数据分析中。我们还考虑了多输入多输出波形协方差矩阵的稳健设计,并证明了我们所提方法的优越性质。总而言之,我们研究拓展和改进目前文献中已有的研究结果,并推动贝叶斯方法、结构方程模型在医学、社会学和心理学等诸多学科中的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
带类别数据、异构数据及不可忽略缺失值的结构方程模型分析
带有不可忽略缺失数据的结构方程模型的统计分析及应用研究
含缺失数据的函数型回归模型的统计分析
正相协及缺失数据情形的经验似然推断