The privacy-preservation should be addressed when the data is collected, stored and analyzed to achieve the more accurate decision-making. For example, the medical big data can be used to level the health status and predict the trend of a disease in a region using the body area network. However, a single health information seriously discloses the user’s privacy, which should be avoided. This project aims to guarantee the universal usability and privacy simultaneously using the cryptographic tools. The privacy-preserving data aggregation is to aggregate the data collected in a region, and upload the aggregated data to the big data platform for the analysis and the usage, in which the privacy of a single data is achieved. The privacy- preserving data aggregation consists of the following issues: 1) the security model and security goals, especially the enhanced robust model suitable for the practical environment, and the system model against the side channel attack; 2) data aggregation satisfying the different security requirement, including the data aggregation with the differential privacy method, and the information theoretically security data aggregation. This project will provide the important academic and technical support for the usability of the data and the privacy preservation in the big data environment.
大数据环境中数据被收集、存储、分析,以实现更为科学的决策,与此同时,数据的隐私保护应受到特别的重视。比如基于体域网的医疗大数据可用来衡量社会的健康水平及疾病发展趋势,但单个用户的健康数据泄露则严重侵犯用户隐私。本项目以密码学工具为基础,保障数据充分利用性与数据隐私保护性的同时实现。具有隐私保护性的数据聚合是一个可行的方法,即对某个区域采集到的数据做聚合,然后将聚合后的数据上传至大数据平台供分析利用,从而保护单个数据的隐私。本项目研究拟解决以下问题:1)大数据环境中的安全模型与安全目标,主要是符合现实环境的安全模型,尤其是抗侧信道攻击及偷窥攻击的安全模型;2)满足不同安全要求的数据聚合研究,包括基于差分隐私的数据聚合研究、具有理论安全的数据聚合等。本研究将对大数据时代的数据利用与隐私保护提供重要的理论支撑与技术保障。
隐私保护是数据开放共享的前提,以往数据隐私处理方法,比如k-匿名、差分隐私等大多依赖可信任的数据中心,由数据中心对存储的数据进行脱敏或者隐私处理。然而,在现实中假设数据中心可信任是不现实的,可行的方法是在数据采集后即对其做隐私化处理,之后经由中间结点传送至数据中心。数据中心在各方的协助下得到隐私化处理的数据,或者是聚合后的数据、或者是实现了去关联化的数据、也可能是真假混在一起的数据,总之,这些数据既可以保证部分可用性,又掩盖了单个数据。本项目的成果包括:1)基于虚拟聚合域的数据聚合,可抵抗极端合谋条件的内部人攻击,并且保证在成员频繁变化场景下,复杂度不大幅度增加,使其具有实际性; 2)保持数据原始性的N-源匿名,通过数据和数据源之间的去关联性,在不需要可信机构的前提下,其他人无法知道哪个数据来自哪个数据源;3)用假轨迹的方法来实现轨迹隐私,对同一个数据源在不同时刻形成的动态数据做隐私保护,由于轨迹形态蕴含人类的行为特征,而这些特征需要由机器学习为工具进行提取,因此生成的假轨迹应该能抵抗机器学习攻击;4)图像发布或分享中的隐私保护,与前述数据隐私有较大的不同,因为图像隐私很多情况下的设计目标,仅仅是抵抗人类肉眼的识别,不需要满足计算意义上的安全目标。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
硬件木马:关键问题研究进展及新动向
中国参与全球价值链的环境效应分析
海量数据分析应用场景下具有隐私保护的数据聚合技术研究
大数据环境下数据层隐私保护性多方密码算法研究
车载网中具有隐私保护功能的车辆声明聚合协议的研究
具有隐私保护的儿童行为视频医学数据获取技术研究