基于深度学习的侧信道分析模型EstraNet

admin 2025年5月26日11:16:06评论5 views字数 2524阅读8分24秒阅读模式
基于深度学习的侧信道分析模型EstraNet

融合Transformer架构与

移位不变特性的新型SCA解决方案

撰文 | 陈龙飞

编辑 | 刘梦迪

一、背景介绍

近年来,学术界探索了许多深度学习(DL)模型应用到侧信道分析(SCA)中。基于Transformer Network(TN)的SCA模型也被引入到学者们的研究中。尽管之前引入的基于TN的模型在掩码和随机延时防护对策的联合保护下仍然可以恢复待攻击设备的密钥,但由于其时间复杂度和空间复杂度均为二次,它无法应用到较长的波形中。

在2024年CHES会议上,来自印度理工学院卡哈拉格普尔分校的Suvadeep Hajra等人提出了一种新型的基于深度学习的侧信道分析模型EstraNet,这是一种新的基于TN的侧信道分析模型。它的时间和内存复杂度都是O(N),能够有效地对抗随机延时和时钟抖动等防护对策。论文作者在三个带有掩码防护的数据集上对EstraNet进行了实验评估,并将PolyCNN、EffCNN和LSTMnet作为基准模型进行对比,对EstraNet中的超参数进行了细致的分析。

二、EstraNet模型介绍

2.1 EstraNet模型结构

EstraNet模型从下到上主要分为三大部分:最下方带有平均池化层的卷积块部分、中间EstraNet层组合部分和最上方概率输出部分。最下方输入为单条波形,最上方输出为模型对该波形预测各类别的概率。单条波形从模型结构最下方输入后,经过平均池化层的卷积块部分转为可以用于EstraNet单层的输入,再经过多层EstraNet组合部分得到预测结果,最终通过Softmax概率输出部分得到最终的各个类别的概率。EstraNet模型结构如下图所示:

基于深度学习的侧信道分析模型EstraNet

EstraNet结构示意

2.2 EstraNet单层结构

EstraNet单层结构与标准Transformer单层结构相比,主要区别在于其对归一化方法和多头注意力机制进行了改进替换。归一化方法采用论文作者提出的“层中心化”方法,注意力机制采用论文作者提出的多头GaussiP注意力机制。EstraNet单层结构如下图所示:

基于深度学习的侧信道分析模型EstraNet

EstraNet单层结构

2.3 EstraNet模型创新组件

EstraNet模型创新组件主要包括“层中心化”方法和多头GaussiP注意力机制。首先对“层中心化”方法进行介绍:

假设对EstraNet单层现在有输入【x0,...,xn-1T∈Rnxd其中n表示输入波形的条数,d表示输入单条波形的点数。首先按照如下公式计算输入序列每个向量的均值:

基于深度学习的侧信道分析模型EstraNet

得到均值后,对输入向量进行重中心化,公式如下:

基于深度学习的侧信道分析模型EstraNet

其中,clc是一个模型训练得到的参数。

最终得到的输出序列即为“层中心化”方法的输出。值得注意的是,标准Transformer结构中的层归一化方法涉及对输入序列中每个向量的重中心化和重缩放,而作者提出的“层中心化”方法只涉及每个向量的重中心化而不涉及重缩放。

多头GaussiP注意力机制是论文作者提出的一种注意力机制,类似于现有的注意力机制,其需要确定采用的核函数以及核函数的映射函数,具体确定的过程本文不再赘述,感兴趣的读者可以阅读原文自行查看。多头GaussiP注意力机制和现有自注意力机制的对比如下图所示,通过改进注意力表示形式、核函数和核函数映射函数等,论文作者新提出的多头GaussiP注意力机制实现了线性的时间复杂度和空间复杂度。

基于深度学习的侧信道分析模型EstraNet

注意力机制对比示意图

三、实验结果

论文作者选用三个基准模型与其提出的EstraNet进行对比,分别是PolyCNN、EffCNN、LSTMNet,分别在ASCAD Fixed Key、ASCAD Random Key、CHES2020 CTF SW3三个不同数据集上进行实验。实验采用的指标为猜测熵,即正确密钥排名最高(一般为0)时所需的最小波形条数,重复计算三次。在具体实验中,论文作者对波形进行预处理,加入不同程度的去同步进行数据增强(为了验证EstraNet的移位不变性)。论文作者分别在三个数据集上对三种基准模型和EstraNet模型采用无去同步、去同步200、去同步400三种不同的实验设置开展实验,并给出了重复三次后的猜测熵最好结果、中位数结果和平均结果。实验结果如下图所示。从这三个结果来看,EstraNet基本都是最优的模型之一。

基于深度学习的侧信道分析模型EstraNet

实验结果示意图

接下来,论文作者采用消融实验,验证了其提出的EstraNet单层内组件的正确性。实验结果如下图所示,在同等设置条件下,“层中心化”方法比其他层归一化方法的猜测熵结果都要好。

基于深度学习的侧信道分析模型EstraNet

层归一化方法对比

而如果将多头GaussiP注意力机制替换为其他注意力机制方法,模型的效果将大打折扣,如下图所示,模型的损失不会随着训练而下降,呈现水平线。

基于深度学习的侧信道分析模型EstraNet

注意力机制对比

最后,论文作者又对EstraNet模型中的超参数取值进行了实验,给出了各个超参数的取值范围,并对EstraNet模型的训练时间与其他基准模型进行了对比,验证了其良好的性能。

四、总结

Suvadeep Hajra等人提出了一种名为EstraNet的新型侧信道分析深度学习模型。EstraNet表现出线性时间复杂度和空间复杂度,显著提高了标准的基于Transformer的模型TransNet的平方时间复杂度和空间复杂度。这种特性使EstraNet适用于波形点数超过10000的波形。此外,EstraNet是移位不变的,使其对波形中的不同步具有鲁棒性。但其也存在不足之处,对于较大去同步或者较大噪声的波形,EstraNet模型表现不佳,仍存在提升的空间。

参考资料

[1] Hajra, S., Chowdhury, S., & Mukhopadhyay, D. (2023). EstraNet: An Efficient Shift-Invariant Transformer Network for Side-Channel Analysis. IACR Trans. Cryptogr. Hardw. Embed. Syst., 2024, 336-374.

基于深度学习的侧信道分析模型EstraNet

往期精彩文章推荐

基于深度学习的侧信道分析模型EstraNet
基于深度学习的侧信道分析模型EstraNet

原文始发于微信公众号(数缘信安社区):基于深度学习的侧信道分析模型EstraNet

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年5月26日11:16:06
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   基于深度学习的侧信道分析模型EstraNethttps://cn-sec.com/archives/4097843.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息