杨珉教授、张谧教授在数据挖掘顶会KDD22上提出深度学习模型产权追溯通用方法

2022年8月27日23:36:33评论76 views字数 1278阅读4分15秒阅读模式

2022年8月，在举办的数据挖掘顶会ACM SIGKDD Conference on Knowledge Discovery and Data Mining上，我实验室的杨珉教授和张谧教授等师生将现有仅能应用于分类模型的指纹追溯技术普遍化，提出一种深度学习模型产权追溯通用方法，首次在千级嫌疑模型库上实现100%的盗版模型识别准确度。

近年来，随着深度学习技术的不断发展，神经网络在各领域得到了广泛的应用，而神经网络的知识产权保护也成为了一个重要问题。神经网络模型的训练通常需要大量的计算资源与数据样本，而攻击者可通过系统攻击、算法攻击等方式窃取模型，并施以模型所有权混淆技术，低成本地完成盗版模型的构建。为对盗版的神经网络进行检测，模型指纹成为近年的新兴研究课题（图1）。然而，现有模型指纹追溯技术大多仅能应用于分类模型保护，且易于被适应性混淆攻击绕过。

▲ 图 1 模型指纹特征提取流程

为了提升模型指纹技术的通用性，项目组首次将现有指纹追溯技术中的指纹验证样本和验证方法等设计模块进行一般化推广，提出基于适应性指纹验证样本（adaptive fingerprinting examples）和元验证器（meta-verifier）的深度学习模型指纹追溯新方法，将用户构造的多种嫌疑模型融入到模型指纹的构建过程中，从而大幅提升所构造指纹的鲁棒性与有效性，并适用于多种下游任务模型（图2）。

▲ 图 2 基于适应性指纹样本和元验证器的新型模型指纹追溯技术

具体而言，项目组利用联合训练自适应指纹和元验证模型，通过嫌疑模型的联合输出来进行模型指纹的检测，适用于多种下游任务模型的知识产权保护：先为目标模型构建多组自适应指纹样本，再检测在嫌疑模型中这些自适应指纹样本的输出是否能通过元验证模型的检测。该指纹检测机制基于嫌疑模型在自适应指纹样本上的输出，而非对抗样本的输出标签，故无关于具体任务类型、不依赖于训练数据，能够广泛应用于各种任务类型的神经网络指纹检测，如分类、回归、生成模型等，以保护神经网络的知识产权，且指纹样本的产生不依赖于训练数据。使用的自适应指纹样本在正、负例嫌疑模型上的输出具有较大的差异，使得元验证模型的输出发生变化，故具有较好的独特性；同时，对于目标模型的后置处理并不能越过元验证模型的分类边界，故具有较好的鲁棒性。

实验表明，项目组提出的方法首次实现任意任务类型（包括分类、回归、生成、目标检测、特征提取等多个任务场景）的模型指纹特征提取，在分类任务上，黑盒/白盒指纹综合性能指标均高于现有最优方法60%以上（图3），在超过1000个模型组成的测试集上，能以100%的精度检出多种经过模型量化、蒸馏、剪枝、微调混淆后的正例嫌疑模型。

▲ 图 3 提出的深度学习模型指纹的追溯能力提升此前最优方法60%以上

转载来源：复旦大学计算机科学技术学院公众号

编辑：LC

复旦白泽战队

一个有情怀的安全团队

还没有关注复旦白泽战队？

公众号、知乎、微博搜索：复旦白泽战队也能找到我们哦~

原文始发于微信公众号（复旦白泽战队）：杨珉教授、张谧教授在数据挖掘顶会KDD22上提出深度学习模型产权追溯通用方法

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

杨珉教授、张谧教授在数据挖掘顶会KDD22上提出深度学习模型产权追溯通用方法

BlockSec | Resupply 协议攻击事件的深度分析和思考

漏洞预警|多家主流蓝牙耳机曝出可被监视漏洞

印度 Max 金融公司数据泄露

韩国重拳出击！Kimsuky APT黑客团伙遭制裁，加密地址首度曝光，美日火速跟进！

澳航遭遇重大网络攻击数百万客户信息恐遭泄露

新的 FileFix 攻击可运行 JScript 并绕过 Windows MoTW 警报

澳航遭史诗级黑客入侵！百万客户信息遭泄露

俄罗斯大型国防承包商遭入侵，黑客声称海军机密文件外泄

近半数遭勒索软件攻击的企业选择支付赎金

MCP工具链首个严重漏洞？一个钓鱼网页，远程劫持开发者电脑

发表评论

在线咨询

微信