数据的可用性问题是k-匿名隐私保护模型带来的一个具有挑战性的问题。受隐私保护要求的制约,即使最优化的k-匿名算法,也不可能产生完全精确的数据,因此,改进k-匿名算法只能在一定程度上提高数据的可用性,不可能彻底解决问题。本项目从数据的不确定性入手,研究k-匿名隐私保护模型下的数据管理和可用性问题。主要研究内容包括: 1)k-匿名隐私保护模型中不确定性数据的建模方法;2)k-匿名隐私保护模型中不确定性数据的世系分析方法;3)k-匿名隐私保护模型中不确定性数据的索引方法;4)k-匿名隐私保护模型中不确定性数据的查询处理方法;5)k-匿名隐私保护模型中不确定性数据的挖掘及联机分析处理方法。研究成果将为数据接收者提供管理和使用源于k-匿名隐私保护模型的不确定性数据的有效方法,对k-匿名隐私保护模型下数据可用性问题的解决和出于隐私保护目的的不确定性数据管理及可用性问题的研究具有开创性的意义。
k-匿名隐私保护模型(及其衍生模型)已经成为数据发布者可信的隐私保护模型,满足k-匿名要求的不确定性数据将会不断地涌现在Internet上。经典的数据库模型和管理系统都没有考虑数据的不确定性,因此,这些不确定性数据将被接收者的数据管理和分析系统当作“垃圾”数据而拒之门外。数据的可用性问题是k-匿名隐私保护模型带来的一个具有挑战性的问题。.本项目从数据的不确定性入手,研究k-匿名隐私保护模型下的数据管理和可用性问题。主要研究成果如下:.1)k-匿名隐私保护模型下不确定性数据的建模方法:针对k-匿名数据的特点,提出5种建模方法,在此基础上,建立了一个描述k-匿名隐私保护模型中不确定性数据的模型空间,并且讨论了模型空间里各种模型的完备性和封闭性等性质。提出了k-匿名关系模型的函数依赖概念与模式分解方法。.2)k-匿名隐私保护模型下不确定性数据的世系分析方法:k-匿名数据的世系包含了原始数据、泛化树和产生的k-匿名数据,其中,泛化树是k-匿名数据世系的核心部分,因此,我们给出了一个根据k-匿名表构建k-匿名数据世系中泛化树的算法,该算法对研究k-匿名数据的可用性具有至关重要的作用。.3)k-匿名隐私保护模型下不确定性数据的索引方法:将泛化属性作为空间数据的一个维度,然后将元组作为空间数据存储在数据库中,提出了基于R-tree的索引方法。.4)k-匿名隐私保护模型下不确定性数据的查询处理方法:分析了k-匿名数据查询问题的复杂度,给出了UK-Rank和NT-Rank两种top-k查询算法。.5)k-匿名隐私保护模型下不确定性数据的挖掘及联机分析处理方法.提出了一种基于k-匿名表的判定树生成算法,该算法避免了经典ID3算法运行前的数据准备工作,进而,提出了k-匿名数据的关联规则挖掘算法,给出了精确查询和区间查询两种k-匿名数据关联规则查询方法。针对k-匿名数据上OLAP的聚集查询,提出了相对于独立属性集的WITH子句约束,增强了用户查询的自定义能力,给出了k-匿名聚集查询的单调性、一致性和可信性三种性质及相关证明。.除上述成果外,在k-匿名隐私保护模型中的k值选定、列存储数据仓库查询方面也提出了新的方法。.本项目的研究成果为数据接收者提供管理和使用源于k-匿名隐私保护模型的不确定性数据的有效方法,为出于隐私保护目的的不确定性数据管理及可用性问题的研究开辟了新路。
{{i.achievement_title}}
数据更新时间:2023-05-31
Protective effect of Schisandra chinensis lignans on hypoxia-induced PC12 cells and signal transduction
Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究
当归红芪超滤物对阿霉素致心力衰竭大鼠炎症因子及PI3K、Akt蛋白的影响
Astragaloside IV exerts angiogenesis and cardioprotection after myocardial infarction via regulating PTEN/PI3K/Akt signaling pathway
一种加权距离连续K中心选址问题求解方法
基于TCM的匿名证明和隐私保护
大数据发布隐私保护中的不确定性问题及其方法研究
基于大时空范围LBS匿名集的推理攻击及隐私保护方法研究
面向数据发布隐私保护的分级多样性匿名方法研究