With the rapid development of information technology and social networking, big data is being gradually come into people's vision, there are increasing demand for big data query processing, showing explosive growth, computation complexity and other characteristics. Meanwhile, in the procedure of big data collection, storage and query processing there are security issues like privacy leakage, which brings serious trouble to users. These characteristics and needs presents new challenges to both the traditional data management and query processing approach. The project aims to building a secure,efficient query processing platform in favor of big data security and privacy protection, support efficient online queries based on distributed storage architecture, efficient access control mechanisms, privacy embedded indexing mechanism,as well as support privacy efficient parallel query language etc. This project will privide platforms for scientific computing, healthcare, smart grid and other industries with strong adaptability, security and good performance. Study of this project has important theoretical and practical significance, it will accelerate the study of basic theory and key technology of big data management, and play an important role in promoting its application in national important areas of aerospace, financials, astronomy and others.
随着社会信息化和网络化的迅速发展,大数据正逐渐走进人们的视野,面对大数据的查询处理需求日益增加,呈现出爆炸式增长、计算复杂化等特点。同时,大数据在收集、存储和查询处理过程中也面临着诸如数据隐私泄露等安全风险,为用户带来严重困扰。这些特点和需求都对传统的数据管理和查询处理方式提出了新的挑战。本项目以构建安全、高效的大数据查询处理平台为目标,研究有利于大数据安全和隐私保护的,支持在线数据高效查询的分布式存储体系结构、高效的大数据安全访问控制机制、大数据的隐私内嵌式索引机制、以及支持隐私定义的高效并行查询语言等基本理论和关键技术,并为科学计算、医疗卫生、智能电网等行业构建自适应性强、安全性能好的数据密集型应用平台提供基础。本课题的研究工作具有重要的理论价值和现实意义,将对大数据管理的基础理论与关键技术的研究起到重要推动作用,对其在航空航天、金融销售、天文气象等国家重要领域的应用起到引导作用。
来自互联网、物流交通、科学计算及生物医药等传统行业的典型应用催生了以隐私保护为特征的大数据查询处理的重大应用需求,亟需在大数据的可扩展性存储与共享、大数据查询处理的高效执行及数据查询逻辑的灵活表达等方面进行创新性研究,本项目依照拟定的研究计划,围绕大数据查询处理展开研究,涉及云端加密数据查询、大数据隐私保护策略推荐、支持差分隐私的代表性频繁项集挖掘算法以及云端大图发布的隐私保护技术等方面的内容。在云数据安全查询方面,针对于可搜索加密算法效率低下的问题,以分治为基础的分组查询算法通过为数据集构建多组精心设计的索引,可以大幅度提高可搜索加密算法在索引构造、陷门生成和查询处理时的效率。针对隐私策略规模呈指数级增长的问题,提出了基于MapReduce的大规模策略天际线处理算法,将MapReduce编程模型应用到传统的隐私策略天际线处理可以大大缩短算法的执行时间。针对发布频繁项集可能会导致攻击者利用频繁项集去获取个人隐私信息的问题,提出了一种高效率、高可用性的频繁项集挖掘方案,确保了数据隐私泄露量最小和挖掘结果具有更高的可用性。本项研究解决了若干关键性基础问题,为大数据的管理和隐私保护需求提供了安全有效的方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
面向云工作流安全的任务调度方法
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
大数据协同计算及查询服务的隐私保护
移动社交网络中面向多维隐私保护的安全查询方法研究
大数据环境下的数据查询隐私保护技术研究
面向云服务的医疗大数据隐私安全风险与隐私保护