公共卫生复杂抽样调查初级抽样单元抽样设计对基于设计方差近似估计的影响

基本信息
批准号:81202287
项目类别:青年科学基金项目
资助金额:23.00
负责人:李镒冲
学科分类:
依托单位:中国疾病预防控制中心慢性非传染性疾病预防控制中心
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:胡楠,姜勇,张梅,蒋炜,包鹤龄
关键词:
初级抽样单元方差估计公共卫生调查复杂抽样设计
结项摘要

Variance estimation of sample statistics is the very point of critical importance in analysis of complex survey data.The design-based method is regarded as the standard way to estimate variance in public health area. However, common analytical softwares usually simplify the structure of complex sample in order to estimate the design-based variance in a simple way, as the variety of complex sampling design often leads to over-complicated estimators of variance. The approximation of variance estimation applied in these softwares could make improper statistical inference under certain circumstances。We therefore plan to conduct computer simulations of various complex sampling in a nationwide public health survey dataset, and then compare the approximate variance estimates with precise ones considering whole sampling scheme within each simulated sampling, so as to explore the effects of primary sampling units (PSU) design on the variance approximation. Our study includes: research on algorithm of the precise variance estimation and development of related computer codes; computer simulations of complex sampling; sensitive analysis of precise and approximate variance estimation under different PSU inclusion probability; research on validty of statistical inferences under variance approximation with varying singleton-within-stratum PSUs. We aim to examine the relationship between PSU sampling design and variance approximation, and to provide rationale for correct application of complex sample analysis and for skills of optimizing PSU sampling design.

样本统计量的方差估计是分析复杂抽样调查数据的关键技术环节,基于设计的方差估计是公共卫生领域的公认方法。然而,由于抽样设计的多样性,基于设计的方差估计形式可能非常复杂,常用统计软件在分析复杂样本时通常简化样本结构以获得方差估计的简单形式。这样的方差近似估计,在某些初级抽样单元(PSU)抽样设计下会导致不正确的统计推断。本课题组拟以公共卫生大型调查数据为研究对象,采取模拟复杂抽样,比较考虑完整抽样设计的方差精确估计和近似估计,研究PSU抽样设计对基于设计的方差近似估计的影响。主要内容包括:方差精确估计算法研究和计算机代码开发;计算机模拟抽样;不同PSU入样概率下方差精确估计和近似估计的敏感性分析;单一PSU层数不同时采取方差近似估计进行统计推断的有效性评价。本研究旨在揭示PSU抽样设计与方差近似估计之关系,为科学应用复杂抽样分析方法,优化PSU抽样设计提供理论依据。

项目摘要

样本统计量的方差估计是分析复杂抽样调查数据的关键技术环节,基于设计的方差估计是公认方法。然而,由于抽样设计的多样性,基于设计的方差估计形式可能非常复杂,通常采用极群方差估计策略,即简化样本结构以获得方差估计的简单形式。 这样的方差近似估计,在某些抽样设计下会导致不正确的统计推断。本课题组以2010年中国慢性病及其危险因素监测中的高血压测量数据为研究对象,通过数十万次模拟复杂抽样,研究了初级抽样单元(PSU)对统计量方差近似估计的影响,旨在揭示 PSU 抽样设计与方差近似估计之关系。研究内容主要包括:①多阶段复杂抽样方差精确估计算法研究和计算机代码开发;②计算机模拟抽样代码开发;③基于模型和基于设计方法在复杂抽样数据描述中的比较;④不同PSU入样概率对方差近似估计的影响;⑤多阶段抽样设计下方差近似估计和精确估计的比较;⑥单一PSU层数不同时采取方差近似估计进行统计推断的有效性评价。研究结果显示:对样本结构存在系统偏差的复杂抽样数据进行统计描述时,基于设计方法在估计的无偏性和统计推断的有效性方面均优于常规方法和多水平模型;PSU数量的确定需同时考虑估计精度和调查可行性,抽样精度会随着PSU个数增加而增加,但当PSU超过10个后,精度增加已不明显;而PSU入样比过大时(≥30%),极群方差估计策略下方差的估计会出现严重的偏性,当入样比增加到50%左右时,估计偏倚程度可达20%,已不能正确做出统计推断;在模拟的各种复杂抽样设计下,考虑多阶段抽样设计的误差值与真实误差非常接近,且95%CI包含参数的概率均稳定在95%附近,所以当入样比较高时,考虑多阶段抽样设计的误差估计策略应作为多阶段复杂样本误差估计的首选;对单一PSU层对方差估计影响的模拟分析显示,在单一PSU层比例不超过三分之一时,利用其他包含多个PSU层的平均方差来替代估计单一PSU层的方差是较为可靠的,但当单一PSU层比例超过三分之一,则很难通过统计学调整来纠正方差的估计偏性。.本研究的这些结果将有助于优化公共卫生领域复杂抽样设计,并为该领域统计分析人员正确应用基于设计的分析方法提供基础性应用知识,具有重要的理论意义和统计应用价值。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
2

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
3

滚动直线导轨副静刚度试验装置设计

滚动直线导轨副静刚度试验装置设计

DOI:
发表时间:2017
4

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

李镒冲的其他基金

相似国自然基金

1

抽样调查中关于不等概率抽样设计和无回答误差的研究

批准号:11161031
批准年份:2011
负责人:闫在在
学科分类:A0401
资助金额:50.00
项目类别:地区科学基金项目
2

敏感性问题的抽样调查设计

批准号:30571620
批准年份:2005
负责人:高歌
学科分类:H3011
资助金额:25.00
项目类别:面上项目
3

抽样调查中的小域估计方法研究

批准号:11301514
批准年份:2013
负责人:朱荣
学科分类:A0401
资助金额:22.00
项目类别:青年科学基金项目
4

抽样调查的理论与技术

批准号:19271005
批准年份:1992
负责人:孙山泽
学科分类:A0401
资助金额:1.40
项目类别:面上项目