面向用户的数据质量管理方法研究

基本信息
批准号:61472263
项目类别:面上项目
资助金额:83.00
负责人:周晓方
学科分类:
依托单位:苏州大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:赵雷,陆剑江,陈伟,朱雨,郑海彬,Sebastian Link
关键词:
数据库数据溯源数据质量评估数据质量管理大数据
结项摘要

High quality data has become valuable resources and assets in the big data age, for government, research organization and society. With the proliferation of large scale data in every walk of life, people can access and use diversed data service nowadays, but on the other hand, the issue of data quality is now exposed at a much wider and critical level. It is thus important to investigate the data quality management for massive dynamic heterogenous data in the whole data cycle, particularly adapt to the specific data quality requirements from users. This project aims to investigate the generalized data management mechanism in big data age, and the goal is to find data management solutions with superb capability in terms of generalization and scalability. In this way, different data quality standerds and requirements from different application domain can be adapted in an automatic and smooth way. Particularly, we will design a declarative data quality specification language to support flexible and non-procedural quality description. For the scalable complex data, data mining techniques are further used to summarize the quality related key features and measurements of data. From the database level, we conduct data quality evaluation and enhancement based on the specification language, and finally achieve data quality ensurement like integrity constraint support function in relational database system.

在大数据时代,高质量的数据已经成为个政府、企业、研究机构和社会的重要资源与财富。但是随着数据规模的持续高速增长,人们在获取更加丰富、多样的数据同时,也必须面对数据质量管理方面的一系列全新挑战,因此亟需研究能够适应海量、动态、多源、异构数据并贯穿整个数据生命周期的数据质量管理,特别是以用户需求为中心的差异化数据质量保证机制。本项目拟研究一种面向用户自定义需求的通用化数据质量管理机制,重点研究具有通用性和可伸缩性的数据数质量管理机制与方法,使其能够柔性适配不同领域、不同要求的数据质量标准,支持用户对个性化数据质量要求的灵活、非过程化描述;对大规模动态复杂数据,拟采用数据挖掘技术从底层数据出发生成各种与数据质量相关的数据特征表述和度量,并从高层数据质量定义对数据进行约束检验和数据清洗,最终提供诸如关系数据库中的约束条件保证的数据质量保证。

项目摘要

在大数据时代,高质量的数据已经成为个政府、企业、研究机构和社会的重要资源与财富。但是随着数据规模的持续高速增长,人们在获取更加丰富、多样的数据同时,也必须面对数据质量管理方面的一系列全新挑战。本项目研究能够适应海量、动态、多源、异构数据并贯穿整个数据生命周期的数据质量管理,特别是以用户需求为中心的差异化数据质量保证机制。本项目提出要了一种面向用户自定义需求的通用化数据质量管理机制,具有通用性和可伸缩性的数据数质量管理机制与方法,使其能够柔性适配不同领域、不同要求的数据质量标准,支持用户对个性化数据质量要求的灵活、非过程化描述;对大规模动态复杂数据,采用数据挖掘技术从底层数据出发生成各种与数据质量相关的数据特征表述和度量,并从高层数据质量定义对数据进行约束检验和数据清洗,最终提供诸如关系数据库中的约束条件保证的数据质量保证,并产出20余篇高水平论文。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
4

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017
5

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021

周晓方的其他基金

批准号:61772356
批准年份:2017
资助金额:63.00
项目类别:面上项目
批准号:60876016
批准年份:2008
资助金额:38.00
项目类别:面上项目

相似国自然基金

1

基于用户反馈的Web数据集成中的数据质量管理

批准号:61173146
批准年份:2011
负责人:万常选
学科分类:F0207
资助金额:57.00
项目类别:面上项目
2

面向海量数据语义标注众包的任务管理方法研究

批准号:71401096
批准年份:2014
负责人:郝晓玲
学科分类:G0112
资助金额:20.00
项目类别:青年科学基金项目
3

面向网络舆情分析的非确定性数据管理方法研究

批准号:61202214
批准年份:2012
负责人:张铁赢
学科分类:F0214
资助金额:25.00
项目类别:青年科学基金项目
4

面向社交位置大数据的用户潜在兴趣地点挖掘

批准号:61702043
批准年份:2017
负责人:陈晋鹏
学科分类:F0211
资助金额:27.00
项目类别:青年科学基金项目