抽样调查是一种有效、可靠的数据采集方法。随着数字信息和网络技术普及,计算机辅助调查方式得以推广,由此产生了一类新数据- - 并行数据(paradata),用于数据质量的实时监控和改进、数据质量评估、测量误差矫正,以及无回答插补等。本项目应用中国家庭动态跟踪调查(China Family Panel Study,以下简称CFPS)的并行数据和调查数据,研究以下问题:1)臆答行为的监测及其对CFPS数据质量的影响;2)访员诱导行为的监测及其对CFPS数据质量的影响;3)样本确认过程及其对数据质量评估的影响;4)访问帮助使用模式和提示性校验处理模式对数据测量误差的影响;5)访问场景控制与无回答误差校正。综上,本课题拟产出合理的并行数据采集系统,以及可供检验的并行数据与数据质量管理经验。
本课题的研究目标,一是建立并行数据采集系统,向社会推广,提高国内社会调查质量的整体水平;二是积累丰富的并行数据,为并行数据的应用提供数据资源;三是分析并行数据对社会调查数据质量的影响,探索如何应用并行数据评估和改进调查数据质量。. 课题组依据“设计→采集数据、效果评估→修正→再采集数据、效果评估→再修正”的路线进行了研究。借助两波中国家庭跟踪调查和两项全国大规模调查改进了并行数据采集系统,采集并构建了多种并行数据库,分析了并行数据与社会调查数据质量的关系,并且将并行数据的使用经验直接应用到每一次的调查执行过程中。.根据上述研究进程,本课题取得了重要成果:1.首次在全国建立了并行数据采集系统,申请了著作权。该系统处于国际先进水平。由访问管理(含样本信息管理、问卷管理、联系记录管理、样本调配)、发送接收工具、调查支持、数据提取、数据核查系统组成。能够采集到联系记录、样本调配、样本生命周期、访问痕迹、访问时长、访问录音、质控、访员观察、访员信息等多种类型的并行数据。该系统首次实现各种来源并行数据的整合和输入输出调用,安全数据传输,并能低成本、高效、灵活配置到各种调查中。2.在全国首次采集了丰富的并行数据,并且克服了从非结构化的文本文件、录音文件中提取信息的难题,构建了结构化的并行数据库,为后续研究奠定了基础。3.在全国首次将并行数据进行实时监测和实时应用,为其他调查机构提供了调查管理经验。4.首次对中国社会情境中的并行数据和数据质量关系进行了研究。例如,将并行数据应用于数据质量的校正,提出了可操作化的应答代表性指标;在末端抽样样本确认过程中应用并行数据校正抽样误差;形成了访员臆答行为、诱导行为的快速、准确的识别方法,可在调查过程中迅速发现不规范行为,改进数据质量;在社会调查数据质量的影响因素中,除了访员特征、受访者特征之外,发现了访问场景控制、访问帮助的使用模式对数据质量的影响。. 本课题的成果不仅具有学术价值,而且直接转化为采集并行数据的信息科学技术系统,对国内外政府部门、学术机构的信息采集提供了参考和技术支持。例如,本课题的并行数据采集系统在申请著作权时向社会公布了程序代码。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
五轴联动机床几何误差一次装卡测量方法
肉苁蓉种子质量评价及药材初加工研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
中外学术论文与期刊的宏观差距分析及改进建议
基于用户反馈的Web数据集成中的数据质量管理
面向政府大数据资源治理与共享的数据质量管理标准研究
中国调查数据库建设
面向用户的数据质量管理方法研究