每周一篇 Paper 赏析:基于latent样本的对抗训练技术

admin 2022年7月27日20:15:36评论100 views字数 2260阅读7分32秒阅读模式

在经历了考试周和众多DDL之后,本周让我们来看一篇关于adversarial training的文章,假期也不要忘记学习哦!

该文标题为:Adversarial Training and Provable Defenses: Bridging the Gap。发表于ICLR (Oral) 2020,来自ETH的SRILAB (www.sri.inf.ethz.ch),主要思想是使用验证的相关技术来提升对抗样本训练的鲁棒性,提出了一种新的对抗训练方法convex layerwise adversarial training (COLT)。

We propose a new method to train neural networks based on a novel combination of adversarial training and provable defenses. The key idea is to model training as a procedure which includes both, the verifier and the adversary. In every iteration, the verifier aims to certify the network using convex relaxation while the adversary tries to find inputs inside that convex relaxation which cause verification to fail. We experimentally show that this training method is promising and achieves the best of both worlds – it produces a state-of-the-art neural network with certified robustness of 58.1% and accuracy of 78.8% on the challenging CIFAR-10 dataset with a 2/255 L-inf perturbation. This significantly improves over the currently known best results of 53.9% certified robustness and 68.3% accuracy.

背景

为了提升模型的鲁棒性,常见的一种方法是adversarial training,利用对抗样本对网络进行再训练,该方法的实用性已经得到了充分的实验论证,有点是准确率高,但无法提供理论保证。与其相对的一种技术为provable defense,该方法利用验证的思想,可以确保训练出的模型对部分样本具备local robustness,但是缺点是准确率较低。在该文中,作者考虑将两者的训练过程进行一定程度的融合。

We show that it is possible to train more accurate and provably robust neural networks using the same convex relaxations as those used in existing, state-of-the-art provable defense methods, but with a new, different optimization procedure inspired by adversarial training.

关键思想

本文的关键思想来自验证过程的松弛。如上图所示,神经网络真实的鲁棒边界如虚线所示(虚线内可以找到许多对抗样本,当虚线内无法找到对抗样本时,认为对于输入(x) 具有$epsilon$-鲁棒性),但在神经网络验证过程中,为了保证sound并提高运算效率,经常使用relaxation技术,在这种情况下,边界会变为实线所描述的convex形状。

每周一篇 Paper 赏析:基于latent样本的对抗训练技术

本文提出了Latent Adversarial Examples的概念,即聚焦与上图中实线与虚线之间的部分,将在该区域找到的对抗样本也纳入对抗样本训练过程,这相比于传统的对抗训练方法,增加了参与训练的对抗样本数量。

每周一篇 Paper 赏析:基于latent样本的对抗训练技术

方法流程

该方法主要分为两步,第一步为传统的Madry PGD对抗训练,第二步在第一步所得到模型的基础上,继续寻找latent adv,并进行对抗训练。这样可使得得到的模型不断朝实线逼近。

每周一篇 Paper 赏析:基于latent样本的对抗训练技术

第二步的具体实施过程中,作者提出了一种适合于latent adv的训练方法 COLT。

每周一篇 Paper 赏析:基于latent样本的对抗训练技术

该算法的核心思想是,在一个k-layer的神经网络中,从第一层到第k层依次训练,训练完第i层后,固定之前的所有结果,专心寻找i+1层的latent adv并对第i+1层进行训练。

该算法在实现过程中,使用了zonotope对神经网络进行抽象并寻找latent adv,有关zonotope的详细内容,可参考该组的AI^2 (https://www.sri.inf.ethz.ch/publications/gehr2018ai)这篇文章。简单来说,zonotope相比简单的box抽象域,使用仿射运算提高了精度,该抽象被广泛应用于神经网络验证中。

实验结果

实验结果显示,该方法在扰动较小时,可以有效提升对抗训练的Certified Robustness,使得 Adversarial Training 朝着 Provable Defenses 的方向前进。不过,本文的方法更倾向于 Adversarial Training,整个训练过程能提供的Certified内容较少。

每周一篇 Paper 赏析:基于latent样本的对抗训练技术

每周一篇 Paper 赏析:基于latent样本的对抗训练技术


原文始发于微信公众号(上科大系统与软件安全实验室S3L):每周一篇 Paper 赏析:基于latent样本的对抗训练技术

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2022年7月27日20:15:36
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   每周一篇 Paper 赏析:基于latent样本的对抗训练技术http://cn-sec.com/archives/1062338.html

发表评论

匿名网友 填写信息