How to protect data privacy as well as to perform accurate data analysis on large scale, heterogeneous social network has become one of the most important cutting edge research issues in the domain of data mining and privacy protection. The key difficulties of this research issue lie in: how to automatically discover the complex embedded correlation among graph data of multi-relations and multi-attributes. Then, how to design correlation-aware differential privacy protection approach,and eventually to guarantee the high utility of published.graph data while satisfying privacy protection concerns. According to this scientific problem, we proposed the following research contents: (1) propose the semi-supervised clustering method based multi-view intact space learning algorithm, which is used to solve the problem that how to adaptively identify correlated multi-relations; (2) propose the Markov logic net based inferring learning algorithm, which is used to automatically infer the correlated multi-attributes; (3) propose the (θ,r)-bound algorithm and path based SKG graph model, which is respectively used to solve node privacy protection and edge privacy protection of heterogeneous social network; (4) propose the interactive.differential privacy protection method, which is eventually used to solve the issue when given non-zero knowledge and correlated data set, how to protect the privacy of large-scale heterogeneous social network, i.e., the private data publishing.
如何在隐私保护的前提下,对大规模的、数据耦合关系复杂的异构社交网络数据进行高效用的统计分析已经成为数据挖掘和隐私保护领域中的重要前沿交叉课题。这个课题的关键研究难点是:如何在异构社交网络图特征空间中自动识别出多关系、多属性耦合相关关系,并设计出一个耦合感知的差分隐私保护方法,从而在满足隐私保护的前提下确保大规模异构社交网络隐私数据发布的高可用性。本课题围绕这个科学问题,提出了以下研究内容:(1)基于多视图完整空间半监督聚类学习的多关系耦合识别算法,用于解决多关系耦合的自适应识别问题;(2)基于马尔科夫逻辑网的推理学习算法,用于解决多属性耦合的推理识别问题;(3)基于图限定度(θ,r)-bound的保护算法,和基于路径相关的随机Kronecker图模型算法,分别用于解决异构社交网络节点及边的隐私保护问题;(4)基于交互式的差分隐私保护方法,用于解决大规模、累积相关查询结果敏感的隐私保护问题。
如何在隐私保护的前提下,对大规模的、数据耦合关系复杂的异构社交网络数据进行高效用的统计分析已经成为数据挖掘和隐私保护领域中的重要前沿交叉课题。这个课题的关键研究难点是:如何在异构社交网络图特征空间中自动识别出多关系、多属性耦合相关关系,并设计出一个耦合感知的差分隐私保护方法,从而在满足隐私保护的前提下确保大规模异构社交网络隐私数据发布的高可用性。. 本课题围绕这个科学问题,提出了以下研究内容: 基于半监督聚类树的多关系耦合识别算法,用于解决多关系耦合的自适应识别问题; 面向异构稀疏社交网络的表示学习方法,并在此基础上解决隐私保护问题;基于组间组内用户耦合的差分隐私保护方法用以解决异构社交网络节点及边的隐私保护问题。围绕上述研究内容,课题组分别提出基于本地差分隐私保护技术的一系列方法,在公开数据集如Facebook数据集和Enron上,取得较好效果。随后课题组还将现有研究成果延展至隐私数据发布问题上。课题组系列成果证明前期研究思路可行性,所取得成果具有较好的学术价值和应用前景。课题组相关学术结果已发表为期刊会议论文18篇,SCI 收录8篇,EI 收录10篇,其中包括中国计算机协会推荐A类期刊会议3篇、B类期刊4 篇、C类期刊会议2篇。课题组培养硕士、博士生共约十余人,获批一项专利,在申专利两项。通过本课题研究,课题组在大规模异构社交网络隐私保护保护问题上,已经取得了一定的国际学术认可。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
面向云工作流安全的任务调度方法
城市轨道交通车站火灾情况下客流疏散能力评价
社交网络的差分隐私保护方法
面向隐私保护的地理社交网络个性化推荐方法研究
移动社交网络中面向多维隐私保护的安全查询方法研究
移动社交网络中关联社交关系的位置隐私保护研究