数字版权管理(数字水印)
1
概况
数据水印是由数据版权归属方嵌入数据中用以进行版权追溯的信息。一般这种信息具有一定的隐秘性,不对外显示。
在发生数据外泄或者恶意侵犯版权时,数据归属方可根据水印嵌入方式对应的一系列提取算法完成数据中水印信息的提取,以此来声明对该数据的所有权。
数字版权管理是一种使用密钥对数字文件加密的技术。密钥用于锁定或者解锁内容。通常,用户必须获取一个包含密钥的授权文件,来访问目标文件。多数场景下,授权文件还包含对如何使用目标文件的限制。
在数据受到攻击时,水印信息可以做到基本不被破坏,即通过正确的提取算法仍可以做到完整的信息提取,具有一定的健壮性。
数据水印一般是将不影响原始数据主体的、数据量占比较少的数据以一定的方式隐式嵌入大批量的原始数据载体(例如数据库中)。
根据水印嵌入的位置,一般分为两类:一类是嵌入文件头中,一种是嵌入结构型数据的关系表中。
该流程主要包括水印生成、水印嵌入、版权数据发布、攻击、水印提取等。
▲水印生成是利用数据归属方的密钥信息,并结合原始数据属性信息,通过某些算法生成待嵌入的水印;
▲ 水印嵌入是根据原始数据的主键信息,结合密钥信息,通过某些算法确定水印数据嵌入的位置;
▲ 版权数据发布指在将水印嵌入之后,数据就有了版权信息,数据归属方便可将处理后的数据进行发布;
▲ 攻击指的是版权数据遭到了外泄,或者经过某些未授权的操作;
▲ 在数据归属方拿到了外泄或者侵权数据后,可以通过和水印嵌入算法相对应的提取算法对这些数据的水印进行尝试提取,若可提取到有效信息,则说明数据为版权方所有。
2
常见攻击
一、良性更新
二、恶意进行值修改
3
数据水印
(1)隐蔽性
(2)健壮性
(3)不易移除性
(4)安全性
(5)盲检性
4
技术路线
数据嵌入水印要求水印信息具有隐蔽性、可区分性,加入水印信息后的数据具有不失真性,类比到信号处理中,就等同于在原始信号的基础上添加噪声,这个噪声是可区分的,添加方式可为加性添加也可为乘性添加,添加噪声后的信号要求不影响信号特性的估计。根据水印嵌入数据元组的影响方式,水印算法一般可以分为三类。
通过脱敏实现的数据水印技术
针对满足条件的数据内容(长度大于一定值的数字或字母的组合),对特定位置上的字符进行修改。首先,选出某几个位置作为水印信息的嵌入位置,这些位置上的原始字符丢弃即可;然后,使用剩余位置上的字符,通过一定映射和运算后得到与待嵌入长度相同的字符作为水印信息;最后,将生成的水印信息嵌入指定位置即完成水印信息的嵌入,其中位置的选取方法和水印字符的计算方式可设计为和密钥相关的操作。
在水印提取部分,可根据密钥确定水印嵌入位置,根据其余位置的字符和密钥指定的计算方式对水印信息进行计算。若计算得出的水印字符与版权数据中相同位置的字符相同,则水印信息即为密钥对应的信息,否则轮循密钥进行计算比对。
通过低限度修改数据实现的数据水印技术
针对满足条件的数据内容进行按照位置的比特层面的0/1变换。一种常用的方法是R.Agrawal研究的基于统计理论的数据水印算法。此方法是针对数值型属性的水印嵌入方法。该方法约束了数值性属性的值修改的合理范围,目的是在可控的误差范围内的修改不会损害数据的有效性及造成数据的失真。
此方法的基本步骤可概述如下:
首先,选择水印嵌入的元组位置。选择方式通常利用密码学中的单向哈希函数来完成。具体地,通过给定的水印比例、密钥、水印强度及元组主键值等参数,用哈希函数选择待水印的元组。
然后,根据可进行修改的属性的数目和比特位数来确定嵌入水印的属性及比特位。此过程也可使用哈希函数通过模运算来完成。
接着,依据一定的水印嵌入算法将选定元组的待嵌入的属性中的某个比特位的值置为0或者1,即可完成水印信息的嵌入。目前一般使用最低有效位(Least Significant Bit,简称LSB)进行替换。
在提取水印信息时,经过多数选举并根据假设检验理论做出数据中是否存在水印、存在何种水印的判断。
通过添加伪行伪列实现的数据水印技术
2.添加伪列水印
伪造新的属性列,生成的伪列需与原数据中其他属性尽量高度相关,这样不容易被攻击者察觉。伪列属性的选取可使用数据挖掘中的Apriori关联分析法或者一些推荐算法。然后根据选定的属性生成合理的仿真数据,根据密钥信息将水印信息嵌入伪造的新列中,方式与伪行类似。
5
应用场景
数据的可追溯性包括确定数据的可靠性和质量、验证数据的来源、维护数据的版权及查找泄露位置,多用于数据共享的场景。
确定数据质量
数据的质量通常取决于数据的来源及其流转过程。由于当今数据交易量的增加,数据往往由多方传输和处理,这使得数据的溯源更加困难。数据溯源技术可对数据质量进行跟踪验证,定位数据有价值信息损失的环节。
追溯数据源
数据著作权保护
原文始发于微信公众号(东方隐侠安全实验室):数字水印
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论