缺失数据下广义线性模型的经验似然和变量选择问题

基本信息
批准号:11201276
项目类别:青年科学基金项目
资助金额:22.00
负责人:陈夏
学科分类:
依托单位:陕西师范大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:闫莉,董宁,薛媛
关键词:
变量选择广义线性模型缺失数据经验似然
结项摘要

Generalized linear models is used to analyze various types of data. Its application, especially in statistical analysis for the biological、medical、economic and social data, has great significance. Moreover, missing data is often encountered in practice. This project is committed to study the empirical likelihood inference and variable selection for generalized linear models with missing data, including: 1. For the generalized linear models with the data missing at random, we consider the empirical likelihood inference for the unknown parameter. By constructing the auxiliary random vector based on the complete-case data method,the inverse probability weighted method and the imputed value method, the empirical log-likelihood ratio function of unknown parameters are proposed and the results can be used to construct the confidence region of parameters. 2. For the data missing at random, we present a variable selection procedure for genearlized linear models based on the penalized estimating equations. We will show that the proposed variable selection procedure can identify the true model consistently and obtain the convergence rate of the regularized estimators. The simulation study and real data example will show that the proposed empirical likelihood method and the variable selection procedure perform well . This project aims to study the empirical likelihood confidence region of unknown parameter and variable selection for generalized linear models with missing data and will lay a good theoretical basis for its application in practical problems.

广义线性模型是经常用来分析不同类型数据的工具。它在应用上,尤其是在生.物、医学和经济、社会数据的统计分析上,有重要的意义。而数据的缺失是应用中经常出现的问题。本项目致力于缺失数据下,广义线性模型的经验似然推断和变量选择问题的研究,包括:1. 在数据随机缺失下,结合处理缺失数据的完全数据方法、逆概率加权方法、广义借补方法等构造辅助随机向量,提出广义线性模型中未知参数的对数经验似然比统计量,继而给出参数的经验似然置信域。2. 在数据随机缺失下,结合惩罚借补估计方程,提出广义线性模型的变量选择方法。从理论上证明所提出的变量选择方法可以相合地识别出真实模型,并且给出回归系数的正则估计的收敛速度。通过数据模拟和实例研究表明所提出的经验似然推断方法和变量选择方法具有较好的有限样本性质。本项目旨在研究缺失数据下,广义线性模型中的经验似然置信域和变量选择问题,为拓展其在实际问题中的应用奠定良好的理论基础。

项目摘要

广义线性模型是经典线性模型的重要推广,它在应用上,尤其是在生物、医学和经济、社会数据的统计分析上,有重要的意义。而经验似然是一种非常重要的非参数统计方法,它在构造置信域方面有许多突出的优点,例如,无需对渐近方差进行估计、置信域的形状由数据自行决定等。本项目致力于统计模型中的经验似然推断及其应用问题的研究,主要内容有(1) 测量误差部分线性模型中的经验似然推断(2) 固定和自适应设计下广义线性模型的经验似然(3) 响应变量随机缺失下广义线性模型的经验似然推断。通过构造未知参数的对数经验似然比统计量,证明了所构造的统计量的极限分布为标准卡方分布,所得结果可以构造未知参数的置信域。同时可以得到未知参数的极大经验似然估计,证明了它们的渐近正态性质。通过模拟研究和实例验证说明,经验似然方法在置信域的精度及覆盖概率方面优于传统正态逼近方法。本项目旨在研究统计模型中的验似然推断理论,为拓展其在实际问题中的应用奠定良好的理论基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

陈夏的其他基金

批准号:51706005
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:11026132
批准年份:2010
资助金额:3.00
项目类别:数学天元基金项目

相似国自然基金

1

缺失数据下广义线性模型的经验似然方法

批准号:11026132
批准年份:2010
负责人:陈夏
学科分类:A0403
资助金额:3.00
项目类别:数学天元基金项目
2

缺失数据下基于经验似然的稳健推断函数

批准号:11201174
批准年份:2012
负责人:刘天庆
学科分类:A0402
资助金额:23.00
项目类别:青年科学基金项目
3

缺失数据下加速失效时间模型的经验似然推断

批准号:11326178
批准年份:2013
负责人:袁晓惠
学科分类:A0402
资助金额:3.00
项目类别:数学天元基金项目
4

正相协及缺失数据情形的经验似然推断

批准号:11201088
批准年份:2012
负责人:李英华
学科分类:A0403
资助金额:23.00
项目类别:青年科学基金项目