海量数据分析应用场景下具有隐私保护的数据聚合技术研究

基本信息
批准号:61702168
项目类别:青年科学基金项目
资助金额:25.00
负责人:沈华
学科分类:
依托单位:湖北工业大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:谢海涛,张媛媛,李兵兵,蒋炎,姚瑶,冷文韬,陈文倩,黄嘉骏
关键词:
聚合模型数据聚合海量数据数据分析隐私保护
结项摘要

In the analysis process of massive data, if user privacy is not properly protected, it will lead to serious accidents and cause immeasurable economic losses. To address the issue, this project mainly studies data aggregation technologies, the content and the goal are as follows: 1) In view of the huge and dynamically changed data volume, we study the appropriate aggregation models for massive data analysis by using Markov chain theory and heuristic algorithms such as genetic algorithm, particle swarm optimization algorithm, and so on. Several factors affect the design of the model. In our work, the throughput, maintenance cost and calculation cost of the model are the main consideration. 2) Based on the model designed in previous step, we study security data aggregation technologies for multi-granularity data analysis by using cryptography and mathematics tools to meet the application requirement of different granularity analysis of data set. 3) For the variety of massive data, we further study how to securely aggregate heterogeneous data to improve analysis efficiency and reduce resource cost...Our research can be applied in Big Data environment, and can also be deployed in specific-application networks with sensitivity to data privacy, such as the Smart Grids, Wireless Body Area Networks, and so on.

在海量数据的分析过程中没有解决用户隐私保护问题会导致严重事故发生、造成不可估量的经济损失。针对上述问题,本项目以数据聚合技术为研究对象,具体研究内容及目标如下:1)针对海量数据数据量大且实时动态变化的特点,借助马尔可夫链理论和遗传算法、粒子群优化算法等启发式算法从模型的吞吐量、维护代价、计算代价等方面入手研究适用于海量数据分析的聚合模型。2)针对很多应用需要对相同数据集进行不同粒度分析的应用需求,在上述模型基础上借助密码学、数学工具研究支持多粒度数据分析的安全数据聚合技术。3)针对海量数据的多样性,进一步研究支持异构数据的安全数据聚合方法以提高分析效率和减少资源代价。研究成果可用于大数据环境下的安全数据分析,也可用于智能电网、无线体域网等对数据隐私高度敏感的专有网络环境下的安全数据分析。

项目摘要

本项目研究过程中,系统研究了海量数据分析应用场景下保护用户数据、属性、位置等敏感信息的技术和方法,研究核心技术包括:在海量数据处理中实现保护用户数据隐私的聚合模型及方法,在海量用户属性的相关应用中实现保护用户属性隐私的数据聚合技术及协议设计,在海量移动用户的位置服务中实现用户位置隐私的“轻”隐私保护方法及协议设计。研究突出表现在,首先以实现数据安全处理的传统数据聚合方案为研究对象,发现其难于应用到海量数据场景的根本原因和难于同时实现对数据多功能处理的根本原因,设计了支持海量数据处理的聚合模型,设计了一种运用数据聚合技术实现海量数据全局随机扰动的方法,使得数据处理中心可以对数据实施多种处理,克服了传统数据聚合技术在海量数据多功能处理方面的局限性。其次,研究针对时序性数据(比如智能电表收集的用户电量)的数据聚合技术,发现聚合结果的时序性存在泄漏目标用户隐私的威胁,提出了一种新的攻击模型——恶意数据挖掘攻击,并设计了一种抗恶意数据挖掘攻击的数据聚合方案。再次,研究在海量用户属性匹配、交集、特征发现等操作中运用数据聚合技术保护用户属性隐私的方法,设计了具有隐私保护的私有属性交集的方法、具有隐私保护的特征属性统计方法、具有隐私保护的特征用户发现与统计方法。最后,研究轻量级具有隐私保护的位置服务的实现方法,针对会议地点确定服务设计了一种轻量级的隐私保护解决方案,该方案可以获得线性阶的计算和通信开销;针对涉及判断点与多边形位置关系的位置服务,提出了三种具有隐私保护的判断点与任意多边形位置关系的方法。. 依托本项目发表学术论文15篇(其中已被SCI收录10篇,EI收录3篇,中文权威期刊论文1篇(同时EI收录),中文核心期刊论文1篇),申请发明专利14项(其中已授权5项,并有1项授权发明专利已完成转让,交易金额为4万),培养硕士生5名。本研究成果在智能电网、社交网、电子商务、位置服务等领域有良好的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

沈华的其他基金

批准号:51903034
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:81874230
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:61775096
批准年份:2017
资助金额:58.00
项目类别:面上项目
批准号:81101705
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:61308076
批准年份:2013
资助金额:28.00
项目类别:青年科学基金项目
批准号:71173068
批准年份:2011
资助金额:42.00
项目类别:面上项目

相似国自然基金

1

保护隐私的海量数据挖掘

批准号:61202427
批准年份:2012
负责人:桑应朋
学科分类:F0206
资助金额:25.00
项目类别:青年科学基金项目
2

大数据时代具有隐私保护性的数据聚合协议研究

批准号:61662016
批准年份:2016
负责人:刘忆宁
学科分类:F0206
资助金额:39.00
项目类别:地区科学基金项目
3

多源数据融合场景下的对抗式隐私洞察靶向保护技术研究

批准号:61902226
批准年份:2019
负责人:周志刚
学科分类:F0206
资助金额:26.00
项目类别:青年科学基金项目
4

面向新型隐私保护的海量图数据挖掘

批准号:61702132
批准年份:2017
负责人:尹丹
学科分类:F0202
资助金额:25.00
项目类别:青年科学基金项目