大数据发布隐私保护中的不确定性问题及其方法研究

基本信息
批准号:61762059
项目类别:地区科学基金项目
资助金额:36.00
负责人:晏燕
学科分类:
依托单位:兰州理工大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:王万军,高玮军,方君丽,施秋霞,李志浩,蒋兵霞,张涛,吴东方
关键词:
集对分析隐私保护数据发布隐私风险评估大数据不确定信息处理
结项摘要

Under the background of "big data", digitization of personal information and improper use of “big data” can easily lead to the disclosure of sensitive information. At the present stage, the research of privacy-preserving data publishing is mainly aimed at the publishing requirement of small amount of information and some specific types of external attacks. Therefore, it is difficult to directly apply present methods into "big data" with application characteristics of large-scale, high-speed and diversity. There are few reports on the analysis and processing of uncertain information in "big data", and the influence of uncertain information of "big data" on privacy protection.. The project firstly start from the relevance representation between multi-source heterogeneous big data and the privacy information of user, in order to find and extract relevant relationships between privacy information and the others. Secondly, in view of the enhanced data association caused by the fusion of “big data”, a reasonable uncertainty analysis model for privacy protection is designed. Thirdly, an effective privacy risk evaluation criterion as well as the assessment system for privacy protection is designed to dynamically measure the degree and effect of privacy protection for different objects in different environments. Finally, combined with the above theoretical analysis, some uncertainty protection algorithms are designed for privacy-preserving data publishing of “big data”. The correctness of privacy risk assessment and the effectiveness of privacy protection algorithm are proved by some experiments.

在“大数据”时代背景下,个人信息的数字化和大数据的不当使用容易导致用户敏感信息的泄露。现阶段数据发布隐私保护技术的研究主要针对少量信息发布需求和某些特定类型的外部攻击方式,很难直接适用于大数据大规模、高速性和多样性的应用特征。对于大数据中不确定性信息的分析和处理方法,以及大数据不确定信息对隐私保护效果的影响等研究很少。. 本课题首先从多源异构大数据与用户隐私信息的关联表示方法切入,发现并提取大数据中隐私信息与其余信息之间的关联关系。其次,针对大数据融合可能导致的数据关联性增强,设计合理的隐私保护不确定性分析模型。再次,设计有效的隐私风险评估准则和隐私保护评价体系,实现对不同对象在不同环境中的隐私保护程度和隐私保护效果的动态衡量。最后,结合上述理论分析设计相应的大数据隐私发布不确定信息保护算法,通过实验证明隐私风险评估分析的正确性以及相应隐私保护算法的有效性。

项目摘要

大数据在推动各行业技术发展的同时也给隐私安全带来了严峻挑战。因此,对大数据发布隐私保护技术的研究是关系到大数据安全应用和进一步开发使用的重要环节。本项目重点开展了以下研究:(1)针对多源异构大数据关联性隐蔽且复杂、容易导致发布数据隐私泄露的问题,设计了基于图的大数据实体关联表示方法,并进一步抽象为链接待发布数据与已发布数据和外部知识的属性图。分析并定义了属性图中准标识符的作用,从集合的独立性角度出发将准标识符属性的判定问题转化为求解属性图的割点问题,并进一步设计了基于割点的准标识符属性判定算法,为阻止链接攻击实现隐私保护操作确定了关键属性集合。(2)结合大数据发布的特点及应用模式,定义了大数据发布环境下的隐私风险、隐私资产、隐私威胁和隐私脆弱性,构建了三级隐私风险态势评估指标体系。基于集对分析理论设计了隐私风险态势评估的方法,提出基于多元偏联系数的最小二偏赋权方法,消除了隐私风险态势评估过程中不确定性因素对指标权重分配的干扰和影响。(3)针对传统k-匿名隐私保护模型计算复杂度高、信息损失度大、k值难以准确设定等问题,提出基于模糊语义的静态大数据转换发布方法。根据数值型和分类型敏感属性的不同特点,分别设计了基于集对云模型和语义泛化树的模糊发布算法;建立了模糊语义区分度和泛化信息保留度参量,较好的反映出发布信息与原始信息之间的区别与联系。(4)针对位置大数据动态统计发布存在的索引结构和隐私预算不确定性问题,提出基于差分隐私保护模型的分层混合划分发布算法。采用均匀时间间隔内连续发布数据快照的方法对动态位置大数据进行采样平滑处理;通过密度自适应网格划分实现不同采样时刻位置大数据的空间聚类;设计了基于区域均匀性的启发式四叉划分算法和相应的隐私分配策略,不但解决了自顶向下空间划分时难以确定停止条件的问题,同时均衡了噪声误差和均匀假设误差对发布数据查询精度的影响。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

晏燕的其他基金

相似国自然基金

1

数据流发布中的隐私保护理论和方法研究

批准号:61502111
批准年份:2015
负责人:王金艳
学科分类:F0205
资助金额:20.00
项目类别:青年科学基金项目
2

面向高维数据发布的差分隐私保护方法研究

批准号:61702119
批准年份:2017
负责人:欧阳佳
学科分类:F0206
资助金额:25.00
项目类别:青年科学基金项目
3

面向数据发布隐私保护的分级多样性匿名方法研究

批准号:61862019
批准年份:2018
负责人:张攀峰
学科分类:F0206
资助金额:36.00
项目类别:地区科学基金项目
4

群智感知系统中面向数据发布的本地隐私保护机制研究

批准号:61802298
批准年份:2018
负责人:任雪斌
学科分类:F0205
资助金额:27.00
项目类别:青年科学基金项目