概率抽样设计及其统计推断方法

基本信息
批准号:11471335
项目类别:面上项目
资助金额:65.00
负责人:许王莉
学科分类:
依托单位:中国人民大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:褚挺进,杨翰方,张拔群,牛翠珍,周景科,范燕,余味,乔韵璇,贾朝媛
关键词:
模型检验辅助变量随机效应模型半参数模型概率抽样
结项摘要

In epidemiological studies, the relationship between the covariates and the response variables is an important topic. If investigating the interested covariate is too expensive, then how to get more efficient estimators by sampling under a limited budget? Zhou, Xu, Zeng and Cai (2014) proposed probability sampling designs to get two-stage data, which is more efficient than existing methods. In this project, we will mainly study statistical inference for the probability sampling method. If an auxiliary variable for the interested variable exists, we will consider how to make full use of the auxiliary variable in sampling design and statistical inference. For the case where the data set has center effect, we try to apply the probability sampling designs to each center, and use mixed effect models for inference. Probability sampling is only for linear models now, so extending to partial linear models is also one of our project themes. Existing researches on two-stage sampling data are about model estimation, and few about model checking. So it is a significant topic to do model checking based on this kind of data.

在流行病学研究中,协变量对响应变量的影响往往是人们关心的问题之一。如果感兴趣的协变量的数据获取花费很多,在有限资金的情况下,如何获取数据使得模型的估计更有效?Zhou, Xu, Zeng和Cai(2014)提出概率抽样方法得到两阶段数据比目前常用的抽样方法更有效。 本课题致力于研究关于概率抽样方法的统计推断问题. 在感兴趣的协变量存在辅助变量的情况下,我们将考虑如何把辅助变量的信息用到概率抽样和统计推断中,充分利用数据的信息提高有效性。如果数据存在中心效应,本课题试图用概率抽样的方法在不同中心获取数据,用混合效应模型做推断。目前的概率抽样是关于线性模型的统计推断,半参数模型的概率抽样设计也是本课题研究的问题之一。现有的关于两阶段抽样数据的统计推断都是模型估计,模型检验文献中还没有涉及到,关于模型的检验也是非常重要的.

项目摘要

大数据时代的到来,为统计学的发展提出了新的机遇和挑战。现在的数据呈现了数据量庞大,数据产生迅速,数据关系复杂,数据缺失等特点,对传统统计分析方法和理论提出了重大挑战。 本课题致力于研究大数据背景下关于概率抽样方法的统计推断问题,概率抽样获取的数据属于缺失数据的一类数据。该项目对于缺失数据,主要研究了基于该数据的模型估计和假设检验问题,以及在高维数据情况下的变量筛选问题。具体内容包括:高维数据假设检验中原假设个数的估计问题研究;高维均值假设检验问题,使得统计量无论在稀疏信号备择假设和稠密信号备择假设下,都具有很好的功效;研究了纵向数据中的广义变系数模型,在稀疏超高维的情况下筛选变量方法;对于响应变量缺失的情况下,在高维变量的情况,通过降维结构,提出半参数估计方法估计响应变量的均值;在大数据的情况下,修正的Hosmer—Lemeshow检验;对于缺失数据的分析,提出基于矢量艾特肯(VA)方法的加速EM算法;在响应变量缺失的情况下,研究了半参数线性模型中半参数函数是否具有参数结构的假设检验问题; 以及对于高维数据,模型的基于充分降维的稳健估计方程。课题的研究不仅在实际问题中具有重要的意义,在理论研究中也有重大的挑战。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

DOI:10.7498/aps.67.20171903
发表时间:2018
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
5

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020

许王莉的其他基金

批准号:10701079
批准年份:2007
资助金额:15.00
项目类别:青年科学基金项目
批准号:11071253
批准年份:2010
资助金额:21.00
项目类别:面上项目

相似国自然基金

1

两阶段抽样设计及其统计推断方法

批准号:11071253
批准年份:2010
负责人:许王莉
学科分类:A0401
资助金额:21.00
项目类别:面上项目
2

基于社交网络的敏感问题抽样设计与间接统计推断方法

批准号:71901067
批准年份:2019
负责人:陈洒然
学科分类:G01
资助金额:19.00
项目类别:青年科学基金项目
3

基于排序集抽样及其推广取样方法上的次序统计量以及统计推断

批准号:10901009
批准年份:2009
负责人:李涛
学科分类:A0401
资助金额:16.00
项目类别:青年科学基金项目
4

Bootstrap在复杂抽样中的统计推断

批准号:11901487
批准年份:2019
负责人:王中雷
学科分类:A0401
资助金额:25.00
项目类别:青年科学基金项目