Generalized linear models is used to analyze various types of data. Its application, especially in statistical analysis for the biological、medical、economic and social data, has great significance. Moreover, missing data is often encountered in practice. This project is committed to study the empirical likelihood inference and variable selection for generalized linear models with missing data, including: 1. For the generalized linear models with the data missing at random, we consider the empirical likelihood inference for the unknown parameter. By constructing the auxiliary random vector based on the complete-case data method,the inverse probability weighted method and the imputed value method, the empirical log-likelihood ratio function of unknown parameters are proposed and the results can be used to construct the confidence region of parameters. 2. For the data missing at random, we present a variable selection procedure for genearlized linear models based on the penalized estimating equations. We will show that the proposed variable selection procedure can identify the true model consistently and obtain the convergence rate of the regularized estimators. The simulation study and real data example will show that the proposed empirical likelihood method and the variable selection procedure perform well . This project aims to study the empirical likelihood confidence region of unknown parameter and variable selection for generalized linear models with missing data and will lay a good theoretical basis for its application in practical problems.
广义线性模型是经常用来分析不同类型数据的工具。它在应用上,尤其是在生.物、医学和经济、社会数据的统计分析上,有重要的意义。而数据的缺失是应用中经常出现的问题。本项目致力于缺失数据下,广义线性模型的经验似然推断和变量选择问题的研究,包括:1. 在数据随机缺失下,结合处理缺失数据的完全数据方法、逆概率加权方法、广义借补方法等构造辅助随机向量,提出广义线性模型中未知参数的对数经验似然比统计量,继而给出参数的经验似然置信域。2. 在数据随机缺失下,结合惩罚借补估计方程,提出广义线性模型的变量选择方法。从理论上证明所提出的变量选择方法可以相合地识别出真实模型,并且给出回归系数的正则估计的收敛速度。通过数据模拟和实例研究表明所提出的经验似然推断方法和变量选择方法具有较好的有限样本性质。本项目旨在研究缺失数据下,广义线性模型中的经验似然置信域和变量选择问题,为拓展其在实际问题中的应用奠定良好的理论基础。
广义线性模型是经典线性模型的重要推广,它在应用上,尤其是在生物、医学和经济、社会数据的统计分析上,有重要的意义。而经验似然是一种非常重要的非参数统计方法,它在构造置信域方面有许多突出的优点,例如,无需对渐近方差进行估计、置信域的形状由数据自行决定等。本项目致力于统计模型中的经验似然推断及其应用问题的研究,主要内容有(1) 测量误差部分线性模型中的经验似然推断(2) 固定和自适应设计下广义线性模型的经验似然(3) 响应变量随机缺失下广义线性模型的经验似然推断。通过构造未知参数的对数经验似然比统计量,证明了所构造的统计量的极限分布为标准卡方分布,所得结果可以构造未知参数的置信域。同时可以得到未知参数的极大经验似然估计,证明了它们的渐近正态性质。通过模拟研究和实例验证说明,经验似然方法在置信域的精度及覆盖概率方面优于传统正态逼近方法。本项目旨在研究统计模型中的验似然推断理论,为拓展其在实际问题中的应用奠定良好的理论基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
混采地震数据高效高精度分离处理方法研究进展
缺失数据下广义线性模型的经验似然方法
缺失数据下基于经验似然的稳健推断函数
缺失数据下加速失效时间模型的经验似然推断
正相协及缺失数据情形的经验似然推断