Positive association occurs often in reliability theory problems, in percolation theory and in certain multivariate analysis problems. In practice,on the other hand, some data may be missing for various reasons such as unwillingness of some sampled units to supply the desired information, loss of information caused by uncontrollable factors,failure on the part of the investigator to gather correct and so forth. The empirical likelihood (EL) method is introduced by Owen and has many other advantages over normal approximation-based methods and the bootstrap method for constructing confidence intervals.We will use the EL method to make inference for the distribution and some important indices of a population and for some important statistical models under positive samples. We notice that there is few literature on the inference under positively associated samples. Our project is an attractive subject in statistical field and has important theoretical value and practical significance..The project firstly will make inference for the distribution and some important indices of the population, for example, probability density function and quantiles, and then make inference for some important statistical regression models under positively associated samples. Finally we will continue to develop above methods under positively associated samples with missing data. We hope our investigation can provide more powerful and convenient techniques for dealing with real data.
正相协(PA)样本在可靠性理论、渗透理论和某些多元分析问题中较为广泛出现,此外在市场调查、临床试验、医药追踪试验等,由于各种人为或其它不可知因素,都容易导致大量的缺失数据的产生。Owen 提出的经验似然方法是近年来新提出的最重要的非参数统计方法之一, 由此方法得到的估计具有良好的统计性质,用经验似然方法研究PA和缺失数据情形的统计推断是统计界非常关注的热门课题,具有重要的理论价值和实际意义。.本项目拟用经验似然方法讨论PA样本下总体分布、总体的一些重要指标和其它常见统计模型的推断,主要研究如下三个专题:(1)在PA样本下对总体的分布和重要指标(如概率密度函数、分位数等)进行经验似然推断;(2)在PA样本下对一些常见统计模型(如线性模型、非参数回归模型)进行经验似然推断;(3)在缺失数据情形对(1)和(2)进行深入研究。希望通过这些研究为实际数据处理工作者提供较优且切实可行的统计应用工具
在许多实际问题中,样本往往带有一定的相关性,如经济金融时间序列数据通常是相依数据;在可靠性理论、渗透理论和某些多元分析问题中随机变量常常不是独立同分布的,而是有一定的相关性,相依数据在生物医学和金融方面频繁出现。此外,在市场调查、临床试验、医药追踪试验等,由于各种人为或其它不可知因素,都容易导致大量的缺失数据的产生。从而研究相依数据和缺失数据情形的统计推断具有重要的理论价值和实际意义。. 我们在平稳正相协误差下研究线性模型回归向量置信域的构造,证明了所构造的回归向量的经验似然比统计量为渐近卡方分布;在正相协样本情形利用分组方法构造总体分位数的置信区间,证明了构造的分组经验似然比统计量为渐近卡方分布,由此可获得总体分位数的经验似然置信区间;在正相协样本情形,构造了分位数在有限个不同点上的核估计,并在适当的条件下证明了所构造的估计的渐近正态性,获得了任意两个分位数差异的估计的渐近分布;分别在负相协样本下和强混合样本下构造了总体分位数在有限个不同点处的联合经验似然置信域,并且获得了任意两个分位数差异的经验似然置信区间;在强混合样本情形证明了总体概率密度函数(p.d.f)的经验似然比统计量为渐近卡方分布,由此获得了p.d.f的经验似然置信区间;在线性过程误差下利用分组方法研究线性模型回归系数和非参数回归函数置信区间的构造,证明了构造的分组经验似然比统计量为渐近卡方分布,由此可获得回归系数和非参数回归函数的经验似然置信域。 .在缺失数据情形研究了部分线性模型中回归系数的估计,我们分别利用半参数回归填补法和逆概率权填补法填补缺失数据,证明了在这两类填补之下的回归系数估计的渐近正态性,由此构造了回归系数的基于正态逼近的置信区间(域);在强混合样本完全随机缺失情形,我们利用随机补足后得到的“完全样本”对总体均值进行经验似然推断,证明了经验似然比统计量的极限分布为卡方分布;在φ混合样本下,当响应变量满足随机缺失机制时,利用回归填补方法填补缺失的数据,在此基础上给出了线性模型回归系数的估计,并在一定的条件下证明了估计的渐近正态性。.本项目共公开发表学术论文 12 篇,其中 7 篇论文被 SCI 收录,其余5篇论文发表在中文核心期刊上,在本项目的支持下,项目负责人于2013年获国家统计局第十一届全国统计科研优秀成果二等奖1项(排名第三)。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
混采地震数据高效高精度分离处理方法研究进展
零样本学习综述
缺失数据下基于经验似然的稳健推断函数
缺失数据下加速失效时间模型的经验似然推断
缺失数据下部分线性单指标模型的经验似然推断
缺失数据下广义线性模型的经验似然方法