如何使用OpenAttack进行文本对抗攻击

admin

143762
文章

118
评论

2021年9月4日07:25:32评论216 views字数 2208阅读7分21秒阅读模式

如何使用OpenAttack进行文本对抗攻击

关于OpenAttack

OpenAttack是一款专为文本对抗攻击设计的开源工具套件，该工具基于Python开发，可以处理文本对抗攻击的整个过程，包括预处理文本、访问目标用户模型、生成对抗示例和评估攻击模型等等。

功能&使用

OpenAttack支持以下几种功能：

高可用性：OpenAttack提供了易于使用的API，可以支持文本对抗攻击的整个过程；

全面覆盖攻击模型类型：OpenAttack支持句子/单词/字符级扰动和梯度/分数/基于决策/盲攻击模型；

灵活性强&可扩展：我们可以轻松攻击定制目标用户模型，或开发和评估定制的攻击模型；

综合评估：OpenAttack可以从攻击有效性、对抗示例质量和攻击效率等方面全面评估攻击模型；

OpenAttack的使用范围非常广，其中包括但不限于：

为攻击模型提供各种评估基线；

使用其全面评估指标综合评估攻击模型；

借助通用攻击组件，协助快速开发新的攻击模型；

评估机器学习模型对各种对抗攻击的鲁棒性；

通过使用生成的对抗示例丰富训练数据，进行对抗训练以提高机器学习模型的鲁棒性；

工具模块

如何使用OpenAttack进行文本对抗攻击

工具安装

我们可以使用pip安装，或者克隆该项目源码来安装OpenAttack。

使用pip安装（推荐）

pip install OpenAttack

克隆代码库

git clone https://github.com/thunlp/OpenAttack.git
cd OpenAttack
python setup.py install

安装完成之后，我们可以尝试运行“demo.py”来检测OpenAttack是否能够正常工作：

如何使用OpenAttack进行文本对抗攻击

使用样例

基础使用：使用内置攻击模型

OpenAttack内置了一些常用的文本分类模型，如LSTM和BERT，以及用于情感分析的SST和用于自然语言推理的SNLI等数据集。

以下代码段显示了如何使用基于遗传算法的攻击模型攻击SST数据集上的BERT：

import OpenAttack as oa
# choose a trained victim classification model
victim = oa.DataManager.load("Victim.BERT.SST")
# choose an evaluation dataset
dataset = oa.DataManager.load("Dataset.SST.sample")
# choose Genetic as the attacker and initialize it with default parameters
attacker = oa.attackers.GeneticAttacker()
# prepare for attacking
attack_eval = oa.attack_evals.DefaultAttackEval(attacker, victim)
# launch attacks and print attack results
attack_eval.eval(dataset, visualize=True)

高级使用：攻击自定义目标用户模型

下面的代码段显示了如何使用基于遗传算法的攻击模型攻击SST上的自定义情绪分析模型：

import OpenAttack as oa
import numpy as np
from nltk.sentiment.vader import SentimentIntensityAnalyzer


# configure access interface of the customized victim model
class MyClassifier(oa.Classifier):
    def __init__(self):
        self.model = SentimentIntensityAnalyzer()
    # access to the classification probability scores with respect input sentences
    def get_prob(self, input_):
        rt = []
        for sent in input_:
            rs = self.model.polarity_scores(sent)
            prob = rs["pos"] / (rs["neg"] + rs["pos"])
            rt.append(np.array([1 - prob, prob]))
        return np.array(rt)
# choose the costomized classifier as the victim model
victim = MyClassifier()
# choose an evaluation dataset
dataset = oa.DataManager.load("Dataset.SST.sample")
# choose Genetic as the attacker and initialize it with default parameters
attacker = oa.attackers.GeneticAttacker()
# prepare for attacking
attack_eval = oa.attack_evals.DefaultAttackEval(attacker, victim)
# launch attacks and print attack results
attack_eval.eval(dataset, visualize=True)

项目地址

点击底部【阅读原文】获取

精彩推荐

本文始发于微信公众号（FreeBuf）：如何使用OpenAttack进行文本对抗攻击

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

如何使用OpenAttack进行文本对抗攻击

关于OpenAttack

功能&使用

工具模块

工具安装

使用pip安装（推荐）

克隆代码库

使用样例

基础使用：使用内置攻击模型

高级使用：攻击自定义目标用户模型

项目地址

漏洞通告：CVE-2022-0847linux内核提权漏洞复现/原理讲解

利用 CVE-2025-0072 绕过 MTE

CVE 2024-43570 和 CVE-2024-43535 的报告和 POC

浅谈S3标准下存储桶应用中的安全问题

绑定微信功能挖掘的 0-Click 任意账号接管漏洞

重生之网安小FW，某教务一体化系统任意文件写入漏洞

vulnerable_docker（easy）Frp、reGeorg内网穿透、docker逃逸、wpscan爆破，提权

【内网渗透】隐藏通信隧道技术

【SRC】分享某单位众测中的一次高危

重生之网安小FW，某教务一体化系统任意文件写入漏洞

发表评论

在线咨询

微信