数据隐藏发布中聚类可用性的维持在高维及数据动态更新环境下尤为困难:1).聚类对数据个体差异的依赖与隐藏操作弱化个体差异的主要思想存在截然矛盾;2)"维数灾难"导致常用的匿名与随机化隐藏方法失效;3)面向聚类的重发布隐藏中数据聚簇关系可获取为"轨迹跟踪"攻击提供了便利。本课题针对上述问题:1)引入聚类信息核对数据聚类可用性建模,并构建面向聚类的隐私模型;2) 提出数据集内涵与外延概念,构建关于聚类的数值属性类别层次,实现低维数据匿名隐藏中聚类信息核保存;3)借助信息熵概念对数据空间进行划分,借鉴"势能场"理论构建子空间数据对象"等势面"模型,设计启发式扰动策略实现高维数据隐藏中聚类信息核保存;4)提出重发布影响集和边缘记录集概念,对更新后数据进行分类隐藏,避免"轨迹跟踪"导致的隐私泄露。弥补现有研究数据隐藏后难以满足深层应用需求,及对数据集静态、常规维度限制与现实世界复杂数据环境脱节的不足。
数据隐藏发布中聚类可用性的维持在高维及数据动态更新环境下尤为困难:(1) 聚类对数据个体差异的依赖与隐藏操作弱化个体差异的主要思想存在截然矛盾;(2) “维数灾难"导致常用的匿名与随机化隐藏方法失效;(3) 面向聚类的重发布隐藏中数据聚簇关系可获取为“轨迹跟踪”攻击提供了便利。项目组针对上述问题开展了以下研究:(1) 从k邻域对象集这一粒度介于数据分布与数据距离间的"微分布结构"角度定义聚类信息核,提出保邻域隐藏思想,并构建面向聚类的隐私模型;(2) 分析数据对象k邻域结构成因,构建遗传算法与隐藏操作间的映射机制、隐藏操作与空间向量运算间的关联机制,设计基于遗传算法和向量偏转等技术的隐私保护数据发布方法,提出面向聚类的微数据隐藏发布解决方案;(3) 从信息熵角度分析各属性对维持聚类信息核所起的作用,设计隐藏策略,提出面向聚类的高维数据隐藏发布方法;进一步采取分治策略,利用阿基米德螺线和对数螺线旋转特性提出适应高维数据、能更好地兼顾数据聚类可用性与隐私安全性的数据隐藏方案;(4) 在所提出基于螺线旋转数据隐藏方法基础上,通过构建面向动态数据集的隐私泄露风险模型,利用阈值控制和延时发布策略,提出数据动态更新环境下兼顾聚类可用性与隐私安全性的增量式数据隐藏方案。本项目主要关注以数据为中心的复杂约束环境下静态数据隐藏发布问题,在完成项目预期研究工作基础上,项目组对已取得研究成果在以服务为中心的隐私保护位置服务中的应用进行探索,作为项目研究的外延,提出基于Hilbert编码及位置扰动隐藏的保护位置隐私近邻查询解决方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于分形维数和支持向量机的串联电弧故障诊断方法
基于二维材料的自旋-轨道矩研究进展
高维稀疏数据聚类研究
基于约束的高维数据聚类
聚类导向的字典学习及基于稀疏表示的高维数据聚类研究
面向高维数据集成降维的半监督聚类方法研究