In medical, biological and psychological research, latent variable model is an appealing tool to analyze the data with outcomes or potential risk factors measured by several highly correlated observed variables. The hazards regression analysis with latent variables can be used to assess the relationship between the potential risk factors and failure times and it is of great importance in the real data analysis. This proposal targets at developing novel methods and theories under this modeling framework. Specifically, this proposal establishes three hazards regression models with latent variables to investigate the observed and latent risk factors of the failure time of interest. It develops the methods of two-stage Borrow-Strength estimation and complete-data likelihood, and combines with the maximum likelihood theory of factor analysis model and empirical processes theory to establish the theoretical properties. Furthermore, simulation studies are conducted to demonstrate the nice features of proposed methodologies, and a medical study of chronic kidney disease for TypeⅡdiabetic patients is provided for illustrations.
潜变量模型是处理含有多个高度相关变量的数据的有力工具,在医学、生物学和心理学等领域有广泛的应用。将潜变量引入传统生存分析的风险回归模型中,可以研究潜在风险因子对失效时间的影响,在实际应用中具有重要的意义。本项目拟在此问题上开展一些具有拓展性和创新性的工作。在申请者已有的研究基础上,本项目提出了三个含有潜变量的风险回归模型,研究潜变量和相关可观测变量,以及潜变量和失效时间之间的关系。本项目采用二阶段Borrow-Strength方法和完全数据似然方法,结合因子分析模型的极大似然理论和经验过程理论建立所提方法的理论性质。进一步,本项目通过丰富的计算机模拟计算验证所提方法在有限样本下的表现,并将其应用于一项Ⅱ型糖尿病人并发慢性肾病的临床研究中。本项目的研究成果将为含有多维相关变量的生存分析研究提供方法和理论支持。
本项目在含潜变量的风险回归模型框架下,发展了合理高效的统计推断方法来确定潜变量的个数,同时对模型进行参数估计。本项目采用贝叶斯因子来对潜变量个数不同的模型进行两两比对,从而确定最优的模型。进一步,为了解决贝叶斯因子在计算时间和负担上的缺点,本项目将改进的spike-and-slab先验分布引入随机搜索算法中,将潜变量的个数作为参数进行估计,避免两两比对进行模型选择,在计算速度上有了极大改进。本项目还将提出的推断方法扩展到更为广泛的联合模型框架,极大的提高了模型的灵活性,并将此模型和方法应用于一个包含多种类型变量的实际数据集,取得了有建设性的结论。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
相关系数SVD增强随机共振的单向阀故障诊断
山西省大气PM2.5 污染时空分布特征∗
行政审计监管与股价崩盘风险——来自证监会随机抽查制度的证据
考虑时空相关随机行驶时间的车辆路径问题模型与算法
具有潜变量的含指标项半参数回归模型的估计问题
高维协变量下部分线性风险回归模型的变量选择
含潜变量图模型的参数学习和结构学习
协变量含测量误差的删失分位数回归