满足差分隐私的频繁模式挖掘研究

基本信息

批准号：61502047

项目类别：青年科学基金项目

资助金额：21.00

负责人：程祥

学科分类：

依托单位：北京邮电大学

批准年份：2015

结题年份：2018

起止时间：2016-01-01 - 2018-12-31

项目状态：已结题

项目参与者：许胜之,闫晗,唐朋,肖恪,曾宪超

关键词：

频繁序列挖掘差分隐私频繁模式挖掘频繁子图挖掘频繁项集挖掘

结项摘要

Frequent pattern mining is one of the most fundamental problems in data mining, which has a wide range of applications. However, if the data sets involve sensitive personal information, directly publishing or sharing discovered frequent patterns might lead to serious privacy leakage. Differential privacy proposed in recent years provides a feasible way to address such problem. Unlike the anonymization-based privacy models, differential privacy offers a provable privacy guarantee without making assumptions about the adversary’s prior knowledge. How to improve the effectiveness and efficiency of mining while satisfying differential privacy is the major challenge for differentially private frequent pattern mining. In this project, we plan to study the differentially private frequent pattern mining problem for three main types of patterns, i.e., itemset, sequence and subgraph. In particular, we plan to study the following problems: 1) differentially private frequent itemset mining based on depth-first search; 2) differentially private frequent sequence mining with gap constraints; 3) differentially private frequent subgraph mining based on Laplace mechanism. Our research findings will build a solid foundation for the usage of differentially private frequent pattern mining in real-world applications and further studies.

频繁模式挖掘是数据挖据领域最重要的基础性问题之一，具有广泛的应用。然而，如果数据集涉及个人敏感信息，直接发布或分享挖掘得到的频繁模式可能会导致严重的个人隐私泄露问题。近年来提出的差分隐私技术为解决上述问题提供了一种可行的方案。与传统的基于匿名的隐私保护模型不同，差分隐私提供了一种可证明的隐私保证，并且不依赖于攻击者所具有的背景知识。如何在满足差分隐私的条件下，提高挖掘结果的效用和挖掘效率是满足差分隐私的频繁模式挖掘面临的主要挑战。本项目拟针对项集、序列和子图三类主要模式，开展满足差分隐私的频繁模式挖掘研究。具体拟研究：1）满足差分隐私的基于深度优先搜索的频繁项集挖掘方法；2）满足差分隐私的带有间隙约束的频繁序列挖掘方法；3）满足差分隐私的基于拉普拉斯机制的频繁子图挖掘方法。研究成果将为满足差分隐私的频繁模式挖掘在实际领域中的应用以及满足差分隐私的频繁模式挖掘问题的进一步研究奠定坚实基础。

项目摘要

频繁模式挖掘是数据挖据领域最重要的基础性问题之一，具有广泛的应用。然而，如果数据集涉及个人敏感信息（例如，医疗记录、用户行为等），直接发布或分享挖掘得到的频繁模式可能会导致严重的个人隐私泄露问题。近年来提出的差分隐私技术为解决上述问题提供了一种可行的方案。与传统的基于匿名的隐私保护技术不同，差分隐私提供了一种严格、可量化的隐私保护手段，并且所提供的隐私保护强度几乎不依赖于攻击者所掌握的背景知识。通过对相关工作的深入分析，我们发现现有方法在挖掘结果的效用和挖掘效率等方面仍不能满足实际应用需求。因此，本项目对满足差分隐私的频繁模式挖掘问题开展了系统、深入的研究，并提出了一系列的满足差分隐私的频繁模式挖掘新方法。特别地，针对满足差分隐私的频项集挖掘问题，我们首次提出一种基于深度优先搜索的满足差分隐私的频繁项集挖掘方法；针对满足差分隐私的频繁序列挖掘问题，我们首次提出一种支持非连续频繁序列挖掘的满足差分隐私的频繁序列挖掘方法；针对满足差分隐私的频繁子图挖掘问题，我们首次提出一种两阶段的满足差分隐私的频繁子图挖掘方法。实验结果表明，与现有方法相比，本项目所提出的方法能够在相同的隐私保护强度下获得更好的性能。本项目的研究成果完善了满足差分隐私的频繁模式挖掘的理论体系，为满足差分隐私的频繁模式挖掘提供了新思路和新方法，进而推动了频繁模式挖掘在涉及个人敏感信息的数据挖掘任务中的应用。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3778/j.issn.1673-9418.2104120

发表时间：

DOI：10.12005/orms.2019.0029

发表时间：2019

程祥的其他基金

批准号：61872045

批准年份：2018

资助金额：63.00

项目类别：面上项目

批准号：51905530

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

相似国自然基金

基于本地化差分隐私的高效用频繁模式挖掘技术研究

批准号：61902365

批准年份：2019

负责人：王宁

学科分类：F0202

资助金额：27.00

项目类别：青年科学基金项目

满足本地差分隐私的高维数据收集研究

批准号：61872045

批准年份：2018

负责人：程祥

学科分类：F0205

资助金额：63.00

项目类别：面上项目

差分隐私约束下的图数据发布机制与挖掘算法研究

批准号：61862011

批准年份：2018

负责人：刘文芬

学科分类：F0206

资助金额：38.00

项目类别：地区科学基金项目

社交网络的差分隐私保护方法

批准号：61502362

批准年份：2015

负责人：朱天清

学科分类：F0205

资助金额：19.00

项目类别：青年科学基金项目

满足差分隐私的频繁模式挖掘研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于直观图的三支概念获取及属性特征分析

基于直觉模糊二元语义交互式群决策的技术创新项目选择

程祥的其他基金

满足本地差分隐私的高维数据收集研究

交互式柔性触觉驱动器的设计方法研究

相似国自然基金