音频数字水印技术
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.2 人类听觉特性
频域掩蔽算法的具体实现步骤如下:
(1) 计算频谱。 对每16 ms的信号s(n), 其采样点数 N=512, 用Hamming窗h(n)进行加窗处理
8
h(n) 3 [1 cos(2 n )]
2
N
(6 - 1)
第6章 音频数字水印技术
s(n)的功率谱由下式得到
S(k) 10 lg[
s(n), 0≤n<m s(n)+λs(n-m), m≤n<N
(6 - 9)
第6章 音频数字水印技术
原始音频 分段 数据
音频 数据段
水 印 比特
衰减 延时
回声混入 段组合
含水印 音 频 数据
图 6 - 2 回声编码水印嵌入流程图
第6章 音频数字水印技术
在实际的应用中, 为了提高水印嵌入的效率, Gruhl 采取的方法如下:
水印算法运算速度快, 因此除了对回声算法进行研究 外, 一些学者对时域的其他算法进行了深入研究, 提 出了一些新的算法。
第6章 音频数字水印技术
Kim等认为将水印信号嵌入时域中每一个样点会使 人耳产生感知, 他们每间隔一定的距离(3~5个样点), 通过修改样点的幅度值而嵌入水印。 在水印检测时不 需要原始音频信号, 而是根据嵌入水印的样点附近的 样点值估计该点的原始值, 进而获得嵌入的水印。
第6章 音频数字水印技术
层Ⅱ: 频带被划分为30个子带, 最低频3个子带的 所有采样点都用到, 接下来的3个子带的采样点每2个 用到1个, 接下来的6个子带的采样点每4个用到1个, 余下的18个子带的采样点每8个用到1个。 共用到采样 点132个。
第6章 音频数字水印技术
(5) 掩蔽是可以叠加的, 因而在z(i)处具有的总掩蔽 阈值LTg(i)为z(i)处的安静时阈值LTq(i)和所有临
j∈{-2,+2}, if 2<k<63
j∈{-3, -2, +2, +3}, if 63≤k<127
(6 - 3)
j∈{-6, -5, …, -2, +2, …, +5, +6}, if 127≤k≤250
则该成分是纯音。
S (k 1)
S(k)
S (k 1)
Stm (k ) 10 lg[10 10 10 10 10 10 ]
图 6 - 6 回声编码水印提取流程图
第6章 音频数字水印技术
回声水印的嵌入过程也可以看作音频信号和一个回 声内核进行卷积, 回声内核如图6 - 7所示。 图中m是 回声延时, λ是回声的衰减系数。
第6章 音频数字水印技术
1
m
图 6 - 7 回声内核
第6章 音频数字水印技术
6.3.3 其他的时域水印方法 虽然最不重要位方法有一些局限性, 但由于时域
第6章 音频数字水印技术
幅 度 f (t) L
L
L
E1
E2
E3
t
Sec_ 1
Sec_ 2
Sec_ 3
图 6 - 8 使用三个相邻的样点段以嵌入水印示意图
第6章 音频数字水印技术
加 权 系数
w 1.0
t L (a) w为 大 于 1的 情 形
加 权 系数
1.0
w t
L (b) w为 小 于 1的 情 形
图 6 - 9 段边界处的渐变加权曲线
第6章 音频数字水印技术
6.4 变换域音频水印算法
6.4.1 相位水印算法 相位水印算法利用人耳听觉系统对绝对相位不敏感
以及对相对相位敏感的特性, 使用代表水印数据的参 考相位替换原始音频段的绝对相位, 并对其他的音频 段进行调整, 以保持各段之间的相对相位不变。 相位 编码的具体步骤如下:
第6章 音频数字水印技术
6.1.2 音频信号传送环境 在实践中, 含有水印的音频信号从编码到解码之
间有多种可能的传播途径。 这里, 我们仅考虑最普通 的四种情形。
第一种情形是声音文件从一个机器拷贝到另一个 机器, 其中没有任何形式的改变。
第二种情形是信号频数字水印技术
第6章 音频数字水印技术
6.1.4 数字音频水印系统的典型应用 随着音频素材在互联网上的指数级增加, 数字音
频水印技术有着广泛的应用前景: (1) 为了便于对音频素材进行查找和检索, 可以用
水印技术实现元数据(描述数据的数据)的传输, 就是 用兼容的隐藏的带内方式传送描述性信息。
第6章 音频数字水印技术
第三种情形是信号被转换为模拟形式, 通过模拟 线路进行传播, 在终端被重新采样。
第6章 音频数字水印技术
6.1.3 对音频数字水印的要求 要想成功地在数字音频媒体中隐藏水印, 必须注
意以下几方面的要求。 1. 对数据变换处理操作的稳健性 要求水印本身应能经受得住各种有意无意的攻击。
典型的攻击有添加噪声、 数据压缩、 滤波、 重采样、 A/D-D/A转换、 统计攻击等。
(6 - 4)
第6章 音频数字水印技术
(3) 去除被掩蔽成分, 分为以下两步: ① 根据如图6 - 1所示的绝对听阈曲线, 把在绝对 听阈以下的纯音和噪音成分去除。 ② 对相互间隔小于0.5 Bark的多个纯音成分只保留 其中有最大值的那一个。
第6章 音频数字水印技术
比 特误 码 率
0.3 5 0.3 0.2 5 0.2 0.1 5 0.1 0.0 5
第6章 音频数字水印技术
Lie等提出的方法与Kim的方法类似, 不同处是将每 个比特的水印信号嵌入到一段音频信号中。 具体算法 如下所述。
水印嵌入算法: 将音频信号f(x)分段, 每段长度为 L。 将任意相连的三段分别记为sec_1、 sec_2 和sec_3。 每段的能量定义为:
xi L1
E1 f (x)
法。 它利用了人类听觉系统的另一特性: 音频信号在 时域的向后屏蔽作用, 即弱信号在强信号消失之后变 得无法听见。 弱信号可以在强信号消失之后50~200 ms 的作用而不被人耳察觉。
第6章 音频数字水印技术
设音频序列S={s(n), 0≤n<N}, 按下式即可得到含有 回声的音频序列Y:
y(n)=
LTg (i) 10lg 10LTq (i)/0
m
10 LTlm( z( j),z(i))/10
m
10 LTnm ( z( j),z(i))/10
j1
j1
(6 - 8)
第6章 音频数字水印技术
6.3 时域音频水印算法
6.3.1 最不重要位方法 最不重要位方法是一种最简单的水印嵌入方法。
第6章 音频数字水印技术
2. 听觉相似性 数字水印是在音频载体对象中嵌入一定数量的掩蔽 信息, 为使得第三方不易察觉这种嵌入信息, 需谨慎 选择嵌入方法, 使嵌入信息前后不产生听觉可感知的 变化。 3. 是否需要原始数据进行信息提取 根据数据嵌入和提取方案的不同设计, 有些方案 可以不需要借助于原始数据进行信息提取, 这一性能 将影响方案的用途和性能。
第6章 音频数字水印技术
4. 数据提取误码率 数据提取误码率也是音频水印方案中的一个重要技 术指标, 因为一方面存在来自物理空间的干扰, 另一方 面信道中传输的信号会发生衰减和畸变, 再加上人为的 数据变换和攻击, 都会使数据提取的误码率增加。 5. 嵌入数据量指标 根据用途的不同, 在有些应用场合中必须保证一定 的嵌入数据量, 如利用音频载体进行隐蔽通信。
(1) 假设要嵌入的水印比特为“1011001”, 先将整个 音频信号分成如图6 - 3所示的7段。
(2) 分别使用式(6 - 9), 得到延时分别为m0和m1的两 个含有回声的信号, 如图6 - 4所示。
(3) 构造“1”混合信号和“0” 混合信号, 如图6 - 5所 示。
第6章 音频数字水印技术
第6章 音频数字水印技术
第6章 音频数字水印技术
6.1 概述 6.2 人类听觉特性 6.3 时域音频水印算法 6.4 变换域音频水印算法 6.5 其他类型的水印算法 6.6 音频水印的评估标准和攻击 6.7 小结
第6章 音频数字水印技术
6.1 概 述
6.1.1 音频信号的数字化 音频信号的数字化是指对模拟的声音信号进行A/D
第6章 音频数字水印技术
(1) 设原始音频序列为 S={s(i), 0≤i<L}
将S分割成N个等长的小段 sn={sn(i), 0≤n<N, 0≤i<K}
其中K=L/N。
(6 - 13) (6 - 14)
第6章 音频数字水印技术
(2) 对第n段sn(i)进行K点的离散傅里叶变换(DFT)。 生成相位矩阵φn(ωk)和幅度矩阵An(ωk)(0≤k<K)。
a
b
c
d
e
f
g
1
0
1
1
0
0
1
图 6 - 3 将原始信号分为小段以嵌入数据
第6章 音频数字水印技术
a
b
c
d
e
f
g
m1
1
0
1
1
0
0
1
m0
1
0
1
1
0
0
1
图 6 - 4 产生“1”和“0”回声信号(用虚线表示)
第6章 音频数字水印技术
a
b
c
d
e
f
g
1 1 0
1 0
0
1
1
0
0
1
“ 1”混 合 信 号
“ 0”混 合 信 号
转换, 使其转化为数字信号。 这个过程有两个重要的 参数: 量化精度和瞬态采样频率。
第6章 音频数字水印技术
对高质量音频的量化方式最流行的格式是16 bit线 性量化, 如Windows可视音频格式(WAV)和音频交换文 件格式(AIFF)。 另一种较低质量音频的量化方式一般采 用8 bit μ律量化。 这些量化方法会使信号产生一些畸 变, 在8 bit μ律量化中显得更为明显。
任何形式的水印都可以转换成一串二进制码流, 而音 频文件的每一个采样数据也是用二进制数来表示。 这 样, 可以将每一个采样值的最不重要位(多数情况下为 最低位)用代表水印的二进制位替换, 以达到在音频信 号中嵌入水印的目的。
第6章 音频数字水印技术
6.3.2 基于回声的水印算法 利用回声嵌入水印的算法是一种经典的音频水印算
1
N 1
s(n)h(n) exp( j2
nk )]2
(6 - 2)
N n0
N
第6章 音频数字水印技术
(2) 确定纯音和噪音成分。 这样做是因为纯音和噪 音的掩蔽模型不同。 如果某个频谱成分的局部极大值 (S(k)>S(k+1)且S(k)≥S(k-1)), 满足下式:
S(k)-S(k+j)≥7 dB
0 30
空域 小 波域
40 50 60 70 80 90 100 JP EG压 缩 品 质
图 6 - 1 绝对听阈曲线图
第6章 音频数字水印技术
(4) 计算局部掩蔽阈值与整体掩蔽阈值。 对原始的N/2(即256) 个频域采样点(用k代表), 只有 其中的一部分采样点(用i代表)被用来计算整体掩蔽阈 值。 层Ⅰ和层Ⅱ所用到的采样点不同。 层Ⅰ: 频带被划分为30个子带, 最低频6个子带中 所有采样点都用到, 接下来的6个子带的采样点每2个 用到1个, 余下的18个子带的采样点每4个用到1个。
(2) 在广播领域中, 可以用水印技术执行自动的任 务, 比如广播节目类型的标识、 广告效果的统计分析、 广播覆盖范围的分析研究等。 其优点是不依赖于特定 的频段。
(3) 用水印技术实现知识产权的保护, 包括所有权 的证明、 访问控制、 追踪非法拷贝等。 这也是水印技 术最初的出发点。
第6章 音频数字水印技术
x xi
E2
xi 2 L1
f
(x)
x xi L
xi 3L1
E3
f
x xi 2 L
(x)
(6 - 10)
第6章 音频数字水印技术
其中xi表示sec_1的起始样点。 将三段的能量按从大 到小进行排列, 重新表示为Emax、 Emid和Emin。 计算它 们的能量差:
A=Emax-Emid B=Emid-Emin
图 6 - 5 构造混合信号
第6章 音频数字水印技术
(4) 将延时为m0的信号和“0” 混合信号相乘, 延时 为m1的信号和“1” 混合信号相乘, 最后将两个信号相 加得到含水印信号。
第6章 音频数字水印技术
含 水 印音 频 数据段
DFT
复 对 数 平 方 ID FT 复 倒 谱的 自 相 关
比较 yˆ(m0 )和 yˆ(m1) 水 印 比 特
(6 - 11)
第6章 音频数字水印技术
(1) 当水印比特为1时, 如果
A-B=Emax-2Emid+Emin≥(Emax+2Emid+Emin)·d, 则不对信号修改; 否则增加Emax或减小Emid, 直至 A-B≥(Emax+2Emid+Emin)·d。
(2) 当水印比特为0时, 如果
B-A=2Emid-Emin-Emax≥(Emax+2Emid+Emin)·d, 则不对信号 修改; 否则增加Emid或减小Emin, 直至 B-A≥(Emax+2Emid+Emin)·d。