The content-based massive encrypted speech retrieval technologies have great potentials in terms of research and application, but with increasing encrypted speech data in the cloud, existing methods have poor performance in recall radio, precision radio, anti-noise property, retrieval efficiency, encryption performance etc. The project is aim at solving the efficient matching retrieval problems of massive encrypted speech, taking encrypted speech as the research carrier and using cloud storage as experimental platforms, we intend to conduct a theoretical analysis and do some novel experiments based on speech signal processing, hash scheme, speech encryption, index structure, encrypted data retrieval, audio watermarking and so on. The content of researches specifically includes: using speech feature extraction, perceptual hash (biometric hash), deep hash, semantic hash, audio fingerprint, encryption, speech authentication, index structure, searchable encryption and so on, focusing on researching speech feature extracting algorithms, hashing generation schemes, index structure, fast classification and similarity matching measure mechanisms, multi-user searchable encryption models, mobile terminal applications, speech content authentication on integrity and legality, and build a novel experimental system for the verification and improvement of this model. In a word, this project aims to implement efficient matching index of massive encrypted speech, reveal realizing principle of multi-user searchable encryption mechanisms. Therefore, we expect to improve capabilities of retrieval models on the security, robustness, retrieval efficiency and accuracy.
基于内容的海量密文语音检索技术有着巨大的研究和应用空间,但云端密文语音数据量的增加,使现有方法在海量应用时查全率、查准率、抗噪能力、检索效率、加密性能等效率较低。本课题针对海量密文语音的高效匹配检索问题,以密文语音为研究载体,以云存储为研究实验平台,综合运用语音信号处理、哈希方法、语音加密、索引、密文检索和音频水印等理论和方法进行理论分析和实验,具体内容为:利用语音特征提取、感知哈希(生物哈希)、深度哈希、语义哈希、音频指纹、加密、语音认证、索引结构和可搜索加密等技术,重点对语音特征提取算法、哈希构造方案、索引结构、快速分类与相似匹配度量算法、多用户语音可搜索加密模型、移动端应用、语音数据合法性和完整性认证等内容进行研究,并建立实验系统进行验证和改进。本课题期望实现海量密文语音的高效匹配检索,揭示多用户语音可搜索加密机制的实现机理,从而提升检索模型的安全性、鲁棒性、检索效率、检索准确度。
基于内容的密文语音检索是音频/语音检索等应用场景保护用户隐私与安全检索的关键技术,用于满足用户对云端海量密文音频数据的快速、安全、精确检索的需求。在项目执行的四年期间,我们根据计划任务书的安排,着重研究了高效的语音特征提取、哈希学习与哈希构造(感知哈希、生物哈希、深度哈希)、哈希索引、语音分类、相似计算、语音加密、安全存储与安全检索、适用于加密语音的可搜索加密机制、可验证语音检索等内容。具体来看,在云环境下建立了基于内容的密文语音检索通用模型,并以此模型研究了高效的语音特征提取方法、基于感知哈希的密文语音检索算法、基于生物哈希的密文语音检索算法、基于深度哈希的密文语音检索算法、用于长语音片段检索的音频指纹检索算法、可验证的密文语音检索算法、基于内容的多用户可搜索加密语音检索、语音加密等方案。另外,为了对不规则时长的语音数据进行高效安全检索,通过构建基于汉语声母和元音的双向循环神经网络-长短期记忆(RNN-LSTM)哈希学习模型,对基于声母和深度哈希的密文语音全文检索方案进行了研究;为了确保加密域语音搜索结果的完整性和真实性,利用设计的鲁棒水印、脆弱水印和感知哈希方案,研究了密文语音内容认证与篡改恢复方案,弥补了现有感知哈希方法不能对加密语音进行篡改恢复的不足;为了避免云端语音数据和哈希索引的隐私泄露,对基于密文策略层次属性的语音加密,适用于语音数据的可搜索加密、混沌加密、同态加密方案进行了研究,也可用于密文计算和语音保密通信传输等领域;为了实现区块链下语音数据的安全存储,对基于区块链和IPFS的密文语音数据分布式存储方案进行了研究。我们在项目执行期间获授权发明专利4项、在国际国内学术期刊或国际学术会议上发表论文32篇,其中SCI和EI期刊检索论文30篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
基于LBS的移动定向优惠券策略
云计算环境中面向内容的密文检索关键技术研究
可信云存储高效密文全文检索模型及关键技术研究
基于视觉语义的云环境密文图像检索研究
基于关键词抽取的云环境密文检索研究