数字水印

admin

144144
文章

118
评论

2023年7月14日13:23:06评论55 views字数 2580阅读8分36秒阅读模式

数字版权管理（数字水印）

概况

数据水印是由数据版权归属方嵌入数据中用以进行版权追溯的信息。一般这种信息具有一定的隐秘性，不对外显示。

在发生数据外泄或者恶意侵犯版权时，数据归属方可根据水印嵌入方式对应的一系列提取算法完成数据中水印信息的提取，以此来声明对该数据的所有权。

数字版权管理是一种使用密钥对数字文件加密的技术。密钥用于锁定或者解锁内容。通常，用户必须获取一个包含密钥的授权文件，来访问目标文件。多数场景下，授权文件还包含对如何使用目标文件的限制。

数字水印

在数据受到攻击时，水印信息可以做到基本不被破坏，即通过正确的提取算法仍可以做到完整的信息提取，具有一定的健壮性。

数据水印一般是将不影响原始数据主体的、数据量占比较少的数据以一定的方式隐式嵌入大批量的原始数据载体（例如数据库中）。

根据水印嵌入的位置，一般分为两类：一类是嵌入文件头中，一种是嵌入结构型数据的关系表中。

数字水印

该流程主要包括水印生成、水印嵌入、版权数据发布、攻击、水印提取等。

▲水印生成是利用数据归属方的密钥信息，并结合原始数据属性信息，通过某些算法生成待嵌入的水印；

▲ 水印嵌入是根据原始数据的主键信息，结合密钥信息，通过某些算法确定水印数据嵌入的位置；

▲ 版权数据发布指在将水印嵌入之后，数据就有了版权信息，数据归属方便可将处理后的数据进行发布；

▲ 攻击指的是版权数据遭到了外泄，或者经过某些未授权的操作；

▲ 在数据归属方拿到了外泄或者侵权数据后，可以通过和水印嵌入算法相对应的提取算法对这些数据的水印进行尝试提取，若可提取到有效信息，则说明数据为版权方所有。

常见攻击

一、良性更新

二、恶意进行值修改

①添加攻击：主要指将一些额外的信息添加到版权数据当中，这些额外的信息主要包括：一定比例的元组（记录）添加、新的属性（列）。有些攻击者甚至会在版权数据的基础上添加属于自己的水印信息以宣告版权归属。

②删除攻击：又叫作抽样攻击，指的是选择版权数据的部分元组和属性进行使用。

③替换攻击：随机或通过一定方式将数据内容替换成不含有水印信息的数据。

④置换攻击：打乱元组或者属性的顺序。

⑤混合攻击：将以上的攻击方式进行组合搭配。

数据水印

根据水印攻击的特点，并结合水印自身的特点，总体上数据水印包含有如下特征。

（1）隐蔽性

（2）健壮性

（3）不易移除性

（4）安全性

（5）盲检性

技术路线

数据嵌入水印要求水印信息具有隐蔽性、可区分性，加入水印信息后的数据具有不失真性，类比到信号处理中，就等同于在原始信号的基础上添加噪声，这个噪声是可区分的，添加方式可为加性添加也可为乘性添加，添加噪声后的信号要求不影响信号特性的估计。根据水印嵌入数据元组的影响方式，水印算法一般可以分为三类。

通过脱敏实现的数据水印技术

针对满足条件的数据内容（长度大于一定值的数字或字母的组合），对特定位置上的字符进行修改。首先，选出某几个位置作为水印信息的嵌入位置，这些位置上的原始字符丢弃即可；然后，使用剩余位置上的字符，通过一定映射和运算后得到与待嵌入长度相同的字符作为水印信息；最后，将生成的水印信息嵌入指定位置即完成水印信息的嵌入，其中位置的选取方法和水印字符的计算方式可设计为和密钥相关的操作。

数字水印

在水印提取部分，可根据密钥确定水印嵌入位置，根据其余位置的字符和密钥指定的计算方式对水印信息进行计算。若计算得出的水印字符与版权数据中相同位置的字符相同，则水印信息即为密钥对应的信息，否则轮循密钥进行计算比对。

通过低限度修改数据实现的数据水印技术

针对满足条件的数据内容进行按照位置的比特层面的0/1变换。一种常用的方法是R.Agrawal研究的基于统计理论的数据水印算法。此方法是针对数值型属性的水印嵌入方法。该方法约束了数值性属性的值修改的合理范围，目的是在可控的误差范围内的修改不会损害数据的有效性及造成数据的失真。

此方法的基本步骤可概述如下：

首先，选择水印嵌入的元组位置。选择方式通常利用密码学中的单向哈希函数来完成。具体地，通过给定的水印比例、密钥、水印强度及元组主键值等参数，用哈希函数选择待水印的元组。

然后，根据可进行修改的属性的数目和比特位数来确定嵌入水印的属性及比特位。此过程也可使用哈希函数通过模运算来完成。

接着，依据一定的水印嵌入算法将选定元组的待嵌入的属性中的某个比特位的值置为0或者1，即可完成水印信息的嵌入。目前一般使用最低有效位（Least Significant Bit，简称LSB）进行替换。

在提取水印信息时，经过多数选举并根据假设检验理论做出数据中是否存在水印、存在何种水印的判断。

通过添加伪行伪列实现的数据水印技术

对原始数据的各个元组和属性的内容不做修改，仅在原始数据的基础上新增伪行（元组）和伪列（属性）。

1.添加伪行水印

根据数据各个属性的数据类型、格式，并以业务含义（若有）作为取值范围进行约束生成仿真的数据，然后根据密钥确定的插入位置对仿真元组进行插入操作。

一般为按照数据元组总数的比例确定伪行的数目，均匀插入；然后按密钥指定的水印计算方式对插入元组中的可修改属性进行水印添加。

在水印溯源时，对数据进行遍历，如果计算符合水印构成的元组的数目超过某个预设的数目或比例，则可认为该数据中存在对应的水印信息。

数字水印

2.添加伪列水印

伪造新的属性列，生成的伪列需与原数据中其他属性尽量高度相关，这样不容易被攻击者察觉。伪列属性的选取可使用数据挖掘中的Apriori关联分析法或者一些推荐算法。然后根据选定的属性生成合理的仿真数据，根据密钥信息将水印信息嵌入伪造的新列中，方式与伪行类似。

应用场景

数据的可追溯性包括确定数据的可靠性和质量、验证数据的来源、维护数据的版权及查找泄露位置，多用于数据共享的场景。

确定数据质量

数据的质量通常取决于数据的来源及其流转过程。由于当今数据交易量的增加，数据往往由多方传输和处理，这使得数据的溯源更加困难。数据溯源技术可对数据质量进行跟踪验证，定位数据有价值信息损失的环节。

追溯数据源

追溯数据源可以标识数据处理的各个环节，发现何时何地生成特定数据，了解何时何地恶意泄露数据或谁偷走了泄露的数据，以确定相应的保护措施和解决方案。追溯数据源可避免数据泄露事件的发生，在发生后也可快速定责。

数据著作权保护

追溯数据源还可以确定和维护数据版权。

原文始发于微信公众号（东方隐侠安全实验室）：数字水印

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

通过低限度修改数据实现的数据水印技术

通过添加伪行伪列实现的数据水印技术

OpenAI获五角大楼2亿美元合同，AI可能间接支持军事行动

论韧性数字安全体系（手稿）

伊朗 Handala 黑客组织全面剖析

江南漫步记1 | 记南京旅行有感

关于路由器Web登录失败故障处理的那些事

美航天供应链委员会（S2C2）首批成员调研报告

网警VS黑客谁的技术更厉害

网络安全行业，如何诠释干就完了

《校园风波起：叛逆学生不服管教，竟远控木马入侵辅导员主机，这是什么操作？》

安全是底线：30字概括低空经济六大关键要素

发表评论

在线咨询

微信