Privacy protection is a crucial requirement in many data query and analysis scenarios. Previous works on privacy protection are generally inapplicable for big data applications because the storage structure, the access scheme, and the relational connections among data for big data are substantially different from traditional data applications. Based on the characteristics of big data environment,such as dynamic storing model and sparse value density, this project aims to investigate techniques that protect privacy for big data queries against two malicious behaviors: direct privacy stealing and privacy inference based on data correlations. To protect privacy against direct privacy stealing, this project proposes to analyze and model storage structures and query schemes of big data, design a privacy-preserving tree (PP-Tree) index and corresponding indexing algorithms to hide sensitive information, and then protect privacy for large-scale heterogeneous raw data. To protect privacy against inference attacks, this project proposes to analyze characteristics of implicit correlations among big data, provide quantitative model for big data correlations, and then design privacy protection techniques for big data correlations. Second, this project also proposes to design privacy-preserving search engine for big data, evaluate and optimize the proposed models and algorithms. Last but not least, it aims to provide comprehensive privacy protection techniques for big data queries. The outcome of this project will be crucial for most big data applications.
防范敏感信息泄露是数据查询及分析的基本要求。大数据时代,数据存储结构、内在关系及访问方式均发生了较大变化,在大数据查询中,现有数据隐私保护技术往往难以有效应用。本项目拟基于大数据环境的数据动态存储模式、数据价值密度稀疏等特征,针对查询过程中两类主要隐私泄露问题:直接窃取隐私和基于相关性的隐私推断,研究大数据环境下数据查询隐私保护技术。针对直接窃取隐私,对大数据的存储结构和访问方式等进行分析和建模,设计敏感信息隐藏的PP-Tree 索引结构,研究基于该索引结构的信息隐藏算法,实现对海量异构原始敏感数据的隐私保护;针对基于相关性的隐私推断,分析大数据的隐含关系特征,研究其隐含相关性量化方法并建模,提出基于大数据隐含相关性的隐私保护方法,构建大数据查询引擎,对相关模型和算法进行实验评估和优化。本项目的研究,将为大数据查询中隐私保护提供理论方法和技术手段,对推动大数据健康快速发展具有重要意义。
大数据环境下,数据大量汇聚,将会造成严重的隐私泄露问题,而且查询的实现大数据价值的根本,因此大数据环境下面向数据查询的隐私保护已成为研究热点和难点。本项目从构建高效的敏感数据索引结构出发,进而设计高效的安全查询方法,同时研究大数据汇聚后数据相关性的隐私保护,实现面向数据查询的隐私保护,具有重要的理论价值和应用前景。.基于项目组前期研究成果,利用典型的树形结构,设计新型的数据结构,可较全面、准确地描述敏感数据;研究敏感数据的加密机制,提出高效的安全查询方法;研究数据中隐含相关性,分析隐含相关可引发的隐私泄露问题,提出高可用性的相关性隐私保护方法,确保大数据环境下敏感数据的隐私保护。.现已完成了项目计划书要求的研究内容和技术指标,突破了若干关键技术,取得了预期研究成果。在面向原始敏感数据的隐私保护研究中,着重研究敏感数据的索引结构以及敏感数据的安全查询等;在敏感数据的索引结构方面,提出了一种名为OPTree的新型数据结构来表示原始敏感数据以及基于两种不同位置关系的规则放置的新策略等;在敏感数据的安全查询方面,分别提出了一种云计算环境下针对非结构化大数据的强隐私保护安全查询技术,一种多数据拥有者模型下的强隐私保护安全查询技术,一种细粒度、安全、通用的查询结果正确性和完整性验证技术。在基于大数据隐含相关性的隐私保护研究方面,量化了两个用户的包含n个节点的每天轨迹间空间相关性带来的社交关系推理攻击以及出了提出一个具有严格数学表达式的n体拉普拉斯框架,并且提出了一个最佳的FGS-Pufferfish隐私保护机制等。在构建查询引擎方面,基于项目的研究成果,自主研发了面向特定领域的垂直搜索引擎和基于多维索引的海量气象数据查询系统等。.在该项目资助下,项目组成员发表或录用论文67篇,其中32篇SCI 检索,33篇EI 检索(源);申请发明专利18项,授权5项,软件著作权登记15项。项目组有5人出国合作交流,邀请了美国、澳大利亚、日本、英国等各国13位学者到湖南大学进行学术交流。有4位学生通过了博士学位论文答辩;有10位学生通过了硕士研究生答辩。.本项目从大数据查询中隐私泄露的两类途径出发,既考虑了大数据环境下敏感信息本身的隐私保护,还考虑了大数据隐含相关性隐私保护。研究成果为大数据查询过程中隐私保护提供了完整解决方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
莱州湾近岸海域中典型抗生素与抗性细菌分布特征及其内在相关性
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
云计算环境下数据库查询验证及数据隐私保护研究
大数据协同计算及查询服务的隐私保护
面向隐私保护的大数据查询处理方法研究
海量数据查询中的双向隐私保护机制研究