并行数据和调查数据质量管理

基本信息
批准号:71171004
项目类别:面上项目
资助金额:42.00
负责人:严洁
学科分类:
依托单位:北京大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:刘能,任莉颖,孙妍,丁华,姚佳慧,孙玉环,吕萍,李力,邹艳辉
关键词:
调查误差并行数据CAI数据质量
结项摘要

抽样调查是一种有效、可靠的数据采集方法。随着数字信息和网络技术普及,计算机辅助调查方式得以推广,由此产生了一类新数据- - 并行数据(paradata),用于数据质量的实时监控和改进、数据质量评估、测量误差矫正,以及无回答插补等。本项目应用中国家庭动态跟踪调查(China Family Panel Study,以下简称CFPS)的并行数据和调查数据,研究以下问题:1)臆答行为的监测及其对CFPS数据质量的影响;2)访员诱导行为的监测及其对CFPS数据质量的影响;3)样本确认过程及其对数据质量评估的影响;4)访问帮助使用模式和提示性校验处理模式对数据测量误差的影响;5)访问场景控制与无回答误差校正。综上,本课题拟产出合理的并行数据采集系统,以及可供检验的并行数据与数据质量管理经验。

项目摘要

本课题的研究目标,一是建立并行数据采集系统,向社会推广,提高国内社会调查质量的整体水平;二是积累丰富的并行数据,为并行数据的应用提供数据资源;三是分析并行数据对社会调查数据质量的影响,探索如何应用并行数据评估和改进调查数据质量。. 课题组依据“设计→采集数据、效果评估→修正→再采集数据、效果评估→再修正”的路线进行了研究。借助两波中国家庭跟踪调查和两项全国大规模调查改进了并行数据采集系统,采集并构建了多种并行数据库,分析了并行数据与社会调查数据质量的关系,并且将并行数据的使用经验直接应用到每一次的调查执行过程中。.根据上述研究进程,本课题取得了重要成果:1.首次在全国建立了并行数据采集系统,申请了著作权。该系统处于国际先进水平。由访问管理(含样本信息管理、问卷管理、联系记录管理、样本调配)、发送接收工具、调查支持、数据提取、数据核查系统组成。能够采集到联系记录、样本调配、样本生命周期、访问痕迹、访问时长、访问录音、质控、访员观察、访员信息等多种类型的并行数据。该系统首次实现各种来源并行数据的整合和输入输出调用,安全数据传输,并能低成本、高效、灵活配置到各种调查中。2.在全国首次采集了丰富的并行数据,并且克服了从非结构化的文本文件、录音文件中提取信息的难题,构建了结构化的并行数据库,为后续研究奠定了基础。3.在全国首次将并行数据进行实时监测和实时应用,为其他调查机构提供了调查管理经验。4.首次对中国社会情境中的并行数据和数据质量关系进行了研究。例如,将并行数据应用于数据质量的校正,提出了可操作化的应答代表性指标;在末端抽样样本确认过程中应用并行数据校正抽样误差;形成了访员臆答行为、诱导行为的快速、准确的识别方法,可在调查过程中迅速发现不规范行为,改进数据质量;在社会调查数据质量的影响因素中,除了访员特征、受访者特征之外,发现了访问场景控制、访问帮助的使用模式对数据质量的影响。. 本课题的成果不仅具有学术价值,而且直接转化为采集并行数据的信息科学技术系统,对国内外政府部门、学术机构的信息采集提供了参考和技术支持。例如,本课题的并行数据采集系统在申请著作权时向社会公布了程序代码。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

五轴联动机床几何误差一次装卡测量方法

五轴联动机床几何误差一次装卡测量方法

DOI:
发表时间:
3

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021

严洁的其他基金

批准号:31000949
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:10926103
批准年份:2009
资助金额:3.00
项目类别:数学天元基金项目
批准号:81072868
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:90209023
批准年份:2002
资助金额:22.00
项目类别:重大研究计划
批准号:31672269
批准年份:2016
资助金额:64.00
项目类别:面上项目
批准号:11001109
批准年份:2010
资助金额:17.00
项目类别:青年科学基金项目
批准号:30672724
批准年份:2006
资助金额:28.00
项目类别:面上项目

相似国自然基金

1

基于用户反馈的Web数据集成中的数据质量管理

批准号:61173146
批准年份:2011
负责人:万常选
学科分类:F0207
资助金额:57.00
项目类别:面上项目
2

面向政府大数据资源治理与共享的数据质量管理标准研究

批准号:92046017
批准年份:2020
负责人:洪学海
学科分类:G0414
资助金额:20.00
项目类别:重大研究计划
3

中国调查数据库建设

批准号:71130001
批准年份:2011
负责人:袁卫
学科分类:G0112
资助金额:150.00
项目类别:重点项目
4

面向用户的数据质量管理方法研究

批准号:61472263
批准年份:2014
负责人:周晓方
学科分类:F0202
资助金额:83.00
项目类别:面上项目