今天为大家介绍北理工沈蒙老师、祝烈煌老师和清华大学徐恪老师、李琦老师发表于USENIX Security 2023的文章,其设计了一种具有高鲁棒性的流量表示:流量汇聚矩阵(Traffic Aggregation Matrix)。该表示将数据包方向、时间以及数量等多维信息汇聚在一起。基于该流量汇聚矩阵,其设计了一个高效的卷积神经网络分类器用于深层次特征提取,实现防御混淆下的流量精准分类。
Meng Shen, Kexin Ji, Zhenbo Gao, Qi Li, Liehuang Zhu, Ke Xu. Subverting Website Fingerprinting Defenses with Robust Traffic Representation.
01
背景
Tor 作为最广泛使用的匿名通信工具,可以防止用户被跟踪、监控和审查。如图所示,Tor通过在客户端和服务器间建立由入口、中间和出口三个志愿节点构成的加密转发信道,使得在整个通信过程中的任何节点都无法同时确定请求的来源及目标,从而实现匿名通信。根据Tor官方的统计数据,每天大约有将近500 万的用户使用Tor 保护自己的隐私。
然而,最近的研究表明,Tor容易遭受网站指纹攻击:攻击者(如ISP、AS等)通过收集访问不同网站时客户端和Tor入口节点间的流量信息(如数据包方向、时间等),在本地训练分类器,可以成功识别Tor用户所访问的网站。
最近的研究也在探索各种防御策略(如添加冗余数据包、延迟数据包或对流量进行分割)抵御此类攻击。这使得实现更加鲁棒的攻击方案充满挑战。
02
现有工作
现有的网站指纹攻击方案有两种:基于传统机器学习/深度学习。
-
基于传统机器学习的方案通过提取流量的粗粒度统计特征,并训练机器学习分类器实现网站指纹攻击。然而,这类粗粒度统计特征很容易被现有防御策略所掩盖。
-
基于深度学习的方案使用流量的原始细粒度信息作为输入,利用深度学习模型自动提取特征。然而,由于防御流量的随机性较强,模型在细粒度特征中难以提取鲁棒的特征。
因此, 要击败现有的防御方案,主要的挑战是设计一种鲁棒的流量表示,提取出稳定的流量特征。
03
方案思路与设计
方案思路
我们从信息泄露的理论角度出发,在庞大的特征集合内分析每个特征在防御流量中泄露的信息量。
我们观察到每秒发送数据包个数在防御流量上泄露的信息量与原始流量一致,表明该特征不易被现有防御干扰。
具体设计
受到该特征的启发,我们设计了一种具有高鲁棒性的流量表示:流量汇聚矩阵(Traffic Aggregation Matrix)。该表示将数据包方向、时间以及数量等多维信息汇聚在一起。具体来说,该表示方法将整条流量划分为固定长度的时隙,然后统计每个时隙的上下行数据包数目,最后将其合并为矩阵。基于时隙统计可以很好的适应数据包填充、延迟这类防御策略对原始流量的混淆,保证流量识别的鲁棒性。并且时隙的大小是毫秒级别,包含足够的信息量,保证流量识别的有效性。
在此基础上,我们提出了一种高鲁棒的网站指纹攻击方案:Robust Fingerprinting。该方案基于流量汇聚矩阵,设计了一个高效的卷积神经网络分类器用于深层次特征提取,实现防御混淆下的流量精准分类。
04
实验评估
封闭世界评估结果:封闭世界假设用户仅访问一个监控网站的集合,这些网站都是攻击者已知并获得样本的。我们在9种防御策略下测试了RF的攻击准确率,与最优的Tik-Tok模型对比,RF平均可以提升8.9%的攻击准确率,最高提升22.05%。
开放世界评估结果:在开放世界下,用户还会访问数量庞大的未监控网站。攻击者仅能获取部分未监控网站样本进行训练。Precision-Recall曲线表明,RF在所有防御策略上显著优于现有攻击方案。
05
防御设计
在本文中我们也设计了一种轻量级的防御方案对抗RF。该方案的核心思想是从训练样本中学习包含关键特征的流量片段,然后将原始流量变形为多个来自其他网站的关键片段,从而实现流量混淆。具体而言,该防御方案由两部分组成:
-
关键片段提取:受到计算机视觉中的类激活图(Class Activation Mapping)可以定位影响模型决策的图片关键区域的启发,我们将类激活图应用到流量分类任务中,实现对流量关键片段的提取。
-
流量变形:通过填充冗余数据包和延迟数据包的方式,可以将流量实时地变形为来自其他网站的关键片段,并将防御开销维持在合理的范围。
封闭世界下的实验结果表明,该方案在合理的防御开销下,可以将RF的准确率降低至52.59%,显著优于现有防御方案。
06
结语
RF使用流量汇聚矩阵作为流量表示,相比以往使用的粗粒度统计特征和原始细粒度特征,它提高了流量表示的鲁棒性, 难以被现有防御策略干扰,并且基于卷积神经网络进行训练,最终实现了在防御机制影响下的高鲁棒网站指纹攻击。与此同时,为了更好地保护Tor用户的隐私,我们期待在本工作的基础上探索新的高效防御策略。
原文链接和代码仓库如下,欢迎大家批评指正。
原文链接:
https://www.usenix.org/conference/usenixsecurity23/presentation/shen-meng
代码仓库:
https://github.com/robust-fingerprinting/RF
原文始发于微信公众号(赛博新经济):一种对抗现有防御机制的高鲁棒网站指纹攻击
- 左青龙
- 微信扫一扫
- 右白虎
- 微信扫一扫
评论