图像可搜索加密（三）：逼近明文检索

2024年4月19日20:05:49评论2 views字数 2602阅读8分40秒阅读模式

一. 引言

在之前的文章[1]中，我们深入探讨了图像领域内可搜索加密技术的主流方法，并重点介绍了一系列以高效性著称的方案。然而，由于加密技术本身的固有限制，这些方法通常只能提取出图像的基本统计特征。在常规的小型测试集上，这类特征的精度往往不足80%，而在面对现实世界复杂多变的挑战时则更显不足。精度、时空效率、安全性往往不能兼得，本文着力于介绍一些牺牲了时空效率的高安全、高精度方案。

二. 明文图像检索技术

在介绍高精度的密文图像检索方案前，我们有必要回顾一下明文图像检索（CBIR）的发展历程：

图1：CBIR特征发展过程

全局特征阶段：在CBIR的早期（上世纪），研究主要集中在全局特征的提取上。全局特征是指从整个图像中提取的特征，如颜色直方图、纹理和形状等。这些特征简单、直观，容易提取，但由于缺乏对图像局部信息的关注，其检索效果在复杂图像上受到限制。

局部特征阶段：进入21世纪，尤其是2000年代初期至2010年代初期，局部特征的提取成为CBIR领域的研究热点。这个时期，技术如SIFT（尺度不变特征变换）和SURF（加速鲁棒特征）等应运而生，它们通过关注图像的特定区域或兴趣点来提高检索的准确性和稳定性。

深度特征阶段：近十年来，随着深度学习特别是卷积神经网络（CNN）的迅猛发展，CBIR技术在2010年代迎来了深度特征阶段。这个时期的研究主要集中在利用深度卷积神经网络提取更为复杂和抽象的图像特征，从而在更广泛的应用场景中实现高效的图像检索。

这里特别介绍下深度特征进行检索时的一些实现细节。图像检索通常是一个无监督的过程，同时对效率要求较高，因此通常会使用在大数据集上预训练完成的模型进行检索。此类方案通常基于成熟的预训练CNN模型（如VGG16）提取出卷积层特征（通常会舍弃最后用于分类的全连接层），然后使用主成分分析（PCA）或其它降维工具压缩卷积特征，并最终使用L1/L2距离等传统比较方法进行实际的距离度量。

三. 密文深度特征

如何在图像加密的基础上实现局部特征乃至深度特征的安全提取呢？事实上，这个问题本质上是一个更广泛的问题：如何在加密数据上执行通用计算过程并得到加密结果？对密码学熟悉的读者可能会想到，可以通过同态加密技术在加密图像上提取特征，这也正是一些早期文献中采用的方法。然而，同态加密除了效率极低外，还被后续研究指出存在安全隐患；相关研究表明，鉴于局部特征提取的复杂性（尤其是涉及大量图像结构信息），使用单服务器提供密文检索服务安全性是难以考虑周全的。

在深度特征逐渐流行的同时，多方安全计算（MPC），这一密码学中的经典技术，也因数据流转的重要性而受到空前关注。这为图像加密搜索提供了新的解决方案：某些深度卷积神经网络在结构上异常简单，仅涉及基本的加减乘运算和比较操作，且其结构信息在初始阶段即可确定。MPC，例如秘密共享技术，被认为能够支持各种加密数据上的运算。它提供了几乎与明文相当的加法运算效率和远高于同态加密的密文比较效率，且不存在噪声累积问题，能够适应各类深度学习模型。关于秘密共享的相关技术细节，读者不妨参考[2]。

因此，在近年的研究中，通常假设有两个不同的云服务提供商（它们之间不共谋）来共同提供图像加密搜索服务，有时还会引入一个轻量级的可信第三方[3]来降低离线阶段的成本（尽管这不是必须的）。一个典型的方案流程如图2所示，具体来说，该过程分为两个阶段：

图2：基于双服务器的图像可搜索加密方案

云服务器储备密文图像库：图像的拥有者首先在本地使用加法秘密共享方法将图像分割成两部分，即每个云服务器拥有一份图像的两个“份额”。由于每个份额中的RGB值都是随机的，这等同于对图像进行加密。然后，云服务器基于秘密共享的基本原语组合构建卷积神经网络的前向传播所需的计算步骤，并确保每个中间结果都符合秘密共享的要求，最终完成密态卷积特征的提取。此时云服务器拥有了图像库及图像特征的一个份额。

云服务器提供密文检索：当有密态查询图像传入时，云服务器将基于相同的流程提取查询图像的密态特征，并进行密态的距离度量，最后返回密态的检索结果。查询者最终可以在本地基于两份图像份额恢复出真实的检索图像。

从上述介绍中容易看出，该方案的效率主要受到所采用的卷积特征提取模型复杂度的影响。一些研究文献指出，即使是使用相对基础的卷积模型，如VGG13或VGG16，也可以在常见的小型测试集上实现超过95%的检索精度。而与此同时，所需的时间消耗仅为特定加密方案的3至5倍。因此，在那些对时间敏感性较低、而对精度要求较高的实际应用场景中，基于双服务器模型的图像可搜索加密方案展现出了显著的实用价值。

四. 总结

在本篇文章中，我们深入探讨了图像可搜索加密领域的一种重要方案。这种方法借鉴了明文内容基于图像检索（CBIR）的策略，从而在加密环境下显著提高了检索精度。结合多方安全计算（MPC）技术和深度学习的最新进展，我们能够简化原本复杂的问题，优化处理时间效率，逐步将曾被认为理论上不可行的方案转变为现实中可实施的解决方案。

在当今大模型大行其道的时代，图像检索已经步入了一个多模态和交互式的新领域；与此同时，隐私计算技术的空前重视也为密码学带来了加速的突破。这不仅是技术更迭的见证，也是我们如何以创新方式保护隐私和提高数据处理效率的典范。我们有理由相信，随着通用技术的持续进步，更多以安全为价值的应用能够加速从理论走向实践的落地。

参考文献

[1]: https://mp.weixin.qq.com/s/ICwRV6fjPqdlLboCzJM_pg

[2]: https://mp.weixin.qq.com/s/AAf7WuPo3R5kYCkI2b_8aw

[3]: Huang K, Liu X, Fu S, et al. A lightweight privacy-preserving CNN feature extraction framework for mobile sensing[J]. IEEE Transactions on Dependable and Secure Computing, 2019, 18(3): 1441-1455.

相关文章：

图像可搜索加密（一）：问题与方案概览

图像可搜索加密（二）：定制化方案及其优化

内容编辑：创新研究院顾奇
责任编辑：创新研究院陈佛忠

原文始发于微信公众号（绿盟科技研究通讯）：图像可搜索加密（三）：逼近明文检索

左青龙
微信扫一扫

右白虎
微信扫一扫

图像可搜索加密（三）：逼近明文检索

Forrester：2024年五大网络安全新威胁

新的R编程漏洞暴露项目面临供应链攻击

SpaceX 遭攻击，泄露近150GB数据以及多份图纸

为什么使用微软AI会加剧现有的数据质量和隐私问题

5000 多台 CrushFTP 服务器被零日漏洞攻击

利用山寨谷歌 Chrome 传播，安全公司披露勒索木马 Brokewell

大众汽车遭黑客入侵长达 5 年，燃油引擎 / 电池等机密文件泄露

原创 | 近年全球石油天然气行业网络安全事件汇总分析

近年全球石油天然气行业网络安全事件汇总分析

开源的Judge0 中存在多个沙箱逃逸漏洞，可导致系统遭完全接管

发表评论