Machine learning has aroused a lot of attention and has been used successfully in many domains. Generally, the training of models requires large, representative datasets, which may be collected from a large number of users and contain sensitive information. And the collected data would be stored and computed by service providers or delegated to an untrusted cloud, which make the privacy issues prominent and severe. .. To solve the privacy issues in multi-source-data machine learning, we first study the problem of adaptive adjustment of privacy policy and propose an adaptive privacy-preserving mechanism to meet the real-time dynamic requirements of users for privacy preservation in complex situations. To preserve the privacy during model training, a privacy-preserving asynchronous machine learning framework with multiple parties is proposed. On the basis of ensuring efficiency, we also design a multi-key privacy-preserving training mechanism and a multi-level privacy-preserving model for diversified multi-key encrypted data. Finally, we study the deterministic fine-grained deletion problem of privacy data. Based on the key-deriving encryption, a kind of key-updating operation for bloke data is designed to achieve the fine-grained deletion. And based on the authentication and signature, a publicly verifiable feedback mechanism for machine learning is also proposed to ensuring the deletion of privacy data.
随着机器学习服务的快速发展,其面临的隐私泄露问题也逐渐受到国家和社会的重视。本项目以机器学习模型训练和应用为中心,从理论方案和系统验证两个角度出发研究多源数据机器学习服务中面临的数据安全和隐私泄露问题:研究任务感知的隐私策略自适应选择问题,设计提出针对不同学习任务和场景的自适应隐私保护机制,从而满足用户在复杂情况下对隐私保护方案的实时动态需求;研究多源数据的机器学习模型安全训练问题,设计面向异步机器学习和多密钥、多样化隐私数据的模型训练和预测机制,在保证计算效率的基础上,解决现有隐私保护方案存在的模型训练准确度低、计算开销大、可用性难以保证等问题;研究隐私数据粒度化删除的确定性反馈机制,设计基于密钥派生加密的块节点密钥更新操作,支持分块或部分数据的粒度化删除操作,提出基于认证签名技术的可公开验证反馈机制,为机器学习服务中隐私数据删除提供可信、可控机制。
机器学习正成为数字经济发展的新引擎,特别是在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下,机器学习将进一步赋能各行各业,推动数字经济深入发展。然而,在大规模数据中进行机器学习所面临的安全问题也正受到越来越广泛的关注。本项目从机器学习服务中数据采集认证、隐私数据安全模型训练、数据安全管理三个方面展开研究,具体如下:. 在数据采集匿名认证方面,针对三因子认证协议中存在的攻击,提出了涵盖多种新型攻击的三因子认证协议安全模型,提出了能够真正实现数据采集匿名认证的协议设计新方法,并设计了三因子匿名认证协议。. 在隐私数据模型安全训练方面,提出了基于轻量级安全计算协议、差分隐私、同态加密等隐私计算技术的模型训练方法与细粒度模型发布机制,实现了机器学习模型训练过程中数据隐私保护,并确保模型训练后实现公平发布利用。同时,设计抗成员推理攻击方案,在模型发布时,个性化的添加差分隐私噪声,从而实现模型发布后的抗推理攻击。. 在数据安全管理方面,提出了基于穿刺加密、属性加密的数据权限撤销方案,从而实现数据在利用完毕后可以高效的细粒度权限撤销,确保用户数据安全利用。考虑到模型训练过程中面临的后门攻击、拜占庭攻击等问题,设计模型修复方案,实现模型训练后的优化与修复,确保训练模型的准确性。. 通过本项目的研究,项目组初步构建了机器学习数据安全利用框架,提出了一套隐私数据安全利用框架,为机器学习服务的大规模安全应用提供支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
隐私保护机器学习关键技术研究
多方机器学习中的隐私保护关键技术研究
保护隐私的多方机器学习关键技术研究
隐私保护的机器学习外包计算研究