In the analysis process of massive data, if user privacy is not properly protected, it will lead to serious accidents and cause immeasurable economic losses. To address the issue, this project mainly studies data aggregation technologies, the content and the goal are as follows: 1) In view of the huge and dynamically changed data volume, we study the appropriate aggregation models for massive data analysis by using Markov chain theory and heuristic algorithms such as genetic algorithm, particle swarm optimization algorithm, and so on. Several factors affect the design of the model. In our work, the throughput, maintenance cost and calculation cost of the model are the main consideration. 2) Based on the model designed in previous step, we study security data aggregation technologies for multi-granularity data analysis by using cryptography and mathematics tools to meet the application requirement of different granularity analysis of data set. 3) For the variety of massive data, we further study how to securely aggregate heterogeneous data to improve analysis efficiency and reduce resource cost...Our research can be applied in Big Data environment, and can also be deployed in specific-application networks with sensitivity to data privacy, such as the Smart Grids, Wireless Body Area Networks, and so on.
在海量数据的分析过程中没有解决用户隐私保护问题会导致严重事故发生、造成不可估量的经济损失。针对上述问题,本项目以数据聚合技术为研究对象,具体研究内容及目标如下:1)针对海量数据数据量大且实时动态变化的特点,借助马尔可夫链理论和遗传算法、粒子群优化算法等启发式算法从模型的吞吐量、维护代价、计算代价等方面入手研究适用于海量数据分析的聚合模型。2)针对很多应用需要对相同数据集进行不同粒度分析的应用需求,在上述模型基础上借助密码学、数学工具研究支持多粒度数据分析的安全数据聚合技术。3)针对海量数据的多样性,进一步研究支持异构数据的安全数据聚合方法以提高分析效率和减少资源代价。研究成果可用于大数据环境下的安全数据分析,也可用于智能电网、无线体域网等对数据隐私高度敏感的专有网络环境下的安全数据分析。
本项目研究过程中,系统研究了海量数据分析应用场景下保护用户数据、属性、位置等敏感信息的技术和方法,研究核心技术包括:在海量数据处理中实现保护用户数据隐私的聚合模型及方法,在海量用户属性的相关应用中实现保护用户属性隐私的数据聚合技术及协议设计,在海量移动用户的位置服务中实现用户位置隐私的“轻”隐私保护方法及协议设计。研究突出表现在,首先以实现数据安全处理的传统数据聚合方案为研究对象,发现其难于应用到海量数据场景的根本原因和难于同时实现对数据多功能处理的根本原因,设计了支持海量数据处理的聚合模型,设计了一种运用数据聚合技术实现海量数据全局随机扰动的方法,使得数据处理中心可以对数据实施多种处理,克服了传统数据聚合技术在海量数据多功能处理方面的局限性。其次,研究针对时序性数据(比如智能电表收集的用户电量)的数据聚合技术,发现聚合结果的时序性存在泄漏目标用户隐私的威胁,提出了一种新的攻击模型——恶意数据挖掘攻击,并设计了一种抗恶意数据挖掘攻击的数据聚合方案。再次,研究在海量用户属性匹配、交集、特征发现等操作中运用数据聚合技术保护用户属性隐私的方法,设计了具有隐私保护的私有属性交集的方法、具有隐私保护的特征属性统计方法、具有隐私保护的特征用户发现与统计方法。最后,研究轻量级具有隐私保护的位置服务的实现方法,针对会议地点确定服务设计了一种轻量级的隐私保护解决方案,该方案可以获得线性阶的计算和通信开销;针对涉及判断点与多边形位置关系的位置服务,提出了三种具有隐私保护的判断点与任意多边形位置关系的方法。. 依托本项目发表学术论文15篇(其中已被SCI收录10篇,EI收录3篇,中文权威期刊论文1篇(同时EI收录),中文核心期刊论文1篇),申请发明专利14项(其中已授权5项,并有1项授权发明专利已完成转让,交易金额为4万),培养硕士生5名。本研究成果在智能电网、社交网、电子商务、位置服务等领域有良好的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
保护隐私的海量数据挖掘
大数据时代具有隐私保护性的数据聚合协议研究
多源数据融合场景下的对抗式隐私洞察靶向保护技术研究
面向新型隐私保护的海量图数据挖掘