DCT域音频水印_嵌入对策和算法_马翼平

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第 7期 2006 年 7 月
电 子 学 报 AC TA ELECTRON I CA SI N ICA
Vo . l 34 N o . 7 Ju ly 2006
DCT 域音频水印 : 嵌入对策和算法
马翼平 , 韩纪庆
(哈尔滨工业大学计算机科学与技术学院 , 黑龙江哈尔滨 150001)
Abstract: W here shou ld w ater m arks be embedded in DCT dom ain in order fo r the aud io w ater m ark to be in inaud ib le and robus t Though m any w orks in the literature agree that w ater m ark shou ld be e m bedded in the m iddlefrequency coefficien ts or percep tually sign ificant com ponen ts, how to deter m ine the pos ition e mbedded has no universal defin ition. A new e m bedd ing s trategy and an algorithm applying the strategy are p roposed for aud io w atermark ing in DCT dom ain based on research o fDCT noise moda.l By defining a no ise sens itiv ity vecto r, am ath relationsh ip bet w een the w ater m ark e m beddable position and the aud ib le quality of the aud io file w ith w ater m ark is set up. F irs t the op ti m al pos ition to be e m bedded based on the inaudible requ ire m ent is selected. Second the pow er coefficient o f w atermark is ad justed to satisfy the require m ent of robustness . So the u t m ost need o f inaud ib le and robust o f aud io w ater m ark ing scheme was filled . It is a good approach to settle the tradeoff betw een the two require m en ts of aud io w ater m ark ing: inaud ib le and robus tness. Experi m ental resu lts de m ons trate that the e m bedd ing strategy is effective and the w ater m arks thus generated are very robus. t Key w ords: digital aud io w ater mark ing; DCT ( D iscrete Cosine T ransfor m ); e mbedd ing strategy; noise sensitiv ity 小波域进行. 与时间域技术相比 , 变换域技术具有更好的 鲁棒性 , 对一般的信号处理和变换有更强的抵抗能力 , 所 以目前变换域技 术研究 得较多 . 在 变换域水 印技 术中 , DCT 域的水印算法由于其计算量较小 , 目前对该领域的研 究比较多 . 鲁棒性和不可听性是音频水印系统的基本要求 , 但它 们是一对互相矛盾的因素 . 影响水印鲁棒性的主要因素有 二个 : 水印结构和嵌入对策 . 不可听性由于直接关系数字 音频信号的商业价值 , 是音频水印用户特别关心的问题之
Aud io W ater m ark i ng in DCT : Embedding Strategy and A lgor ithm
MA Y ipin g, HAN Jiqing
(S choo l o f C om pu ter Scien ce and Techno logy , Harb in Ins titu te of Techno logy , Harb in, H eilong jiang 150001, C h ina)
摘 要: 为保证 DCT域水印的鲁棒性 , 研究水印信号的嵌入位置非常必要 . 对音频载体 , 尽管有许多文献 提出将水印嵌在中频系数或对听觉效果重要的系数上 , 但始终缺乏一个统一的方法. 本文在 DCT 噪声信号模型 研究的基础上 , 提出了一种新的音频水印嵌入位置选择策略和一个应用该策略的自适应音频水印算法. 通过定义 DCT系数的噪声敏感度 , 建立了水印嵌入位置和嵌入水印后的音频信号的听觉感知性之间的关系 , 根据音频水 印的不可听性的要求选择最优的嵌入位置 , 然后调节水印强度来满足鲁棒性的要求 , 从而最大程度地保持音频水 印的不可听性和鲁棒性 , 为解决音频水印嵌入过程中不可听性和鲁棒性之间的矛盾提供了一种策略 . 应用该策 略 , 本文提出了一个自适应音频水印算法. 实验证实了算法的鲁棒性 . 音频水印 ;DCT; 嵌入对策 ; 噪声敏感度 关键词 : 中图分类号 : TN 911. 7 TP391.4 文献标识码 : A 文章编号 : 03722112 (2006) 07126005
k =i + 1
i- 1
(2n + 1) k 2 N (2n + 1)i = f ቤተ መጻሕፍቲ ባይዱn ) + c (i ) E (i )cos 2N = f (n ) + e (i , n ) e (i , n ) = c (i ) E (i )cos (2n + 1)i 2 N
N -1
(3) (4)
其中
. 一些学者则进行了折衷
[ 5] [ 3]
(2) 2 , u ≠0 N 假设在 DCT系数 F (i ) 上添加一个噪声信号 E (i ), 则 转换成时间域序列后的结果成为 : f ′ ( n ) =∑ c ( k) F( k )cos
k= 0
c( u )=
1 , u = 0 N
(2n + 1) k 2 N (2n + 1)i + c (i )[ F (i ) + E (i )] cos 2 N + ∑ c( k) F( k )cos
N -1
F( k)= c( k ) ∑ f( n )cos
n= 0 N- 1
(2n + 1) k 2 N (2n + 1) k 2 N
(1a ) (1b )
声音退化的程度 , 是一个需要着重考虑但实际上却常常被 忽视的一个问题 . 在音频信息处理中 , 大多数的退化程度 或听觉质量评价均属于差别失真评测准则 (D ifference D isto rtion M easures ), 这些准则都是从原始音频与退化或失真 [ 10 ] 音频的数学对比得到的 . 目前水印研究中对这种音频 降质的度量均借鉴音频编码及压缩中的方法 , 即通过信噪 比 (Signal to N oise Ratio, SNR ) 或峰值信噪比 (Peak S ignal to N o ise R atio, PSNR ) 来衡量嵌入水印后音频信号的听觉 质量 . 假设 A 是含有 N 个采样点的原始数字音频信号 , 它可
1 引言
多媒体技术及计算机网络的日益普及 , 使得数字多媒 体信息的广泛传播变得非常容易 , 如何既充分利用因特网 的便利 , 又能有效地保护知识产权 , 已受到人们的高度重 视 . 作为传统密码学方法的有效补充手段 , 数字水印技 术在近年来获得了很大的发展 . [ 2] 人们已经提出了许多种数字水印的算法 , 有的技术 是在时间域上进行嵌入 , 有的算法则是在变换域 , 如 DCT 、
N- 1
提出 DCT
的 DC 分量比 AC 分量有更大的感觉容量 , 水印应该更多 的嵌入在 DCT 的 DC 分量上 . 而在音频水印中 , 还没有研 究者提出一个统一的 、定量的标准来确定嵌入位置的选择 策略. 本文利用 DCT 变换的噪声信号模型 , 定义音频信号 DCT系数的噪声敏感度 , 建立了水印嵌入位置与音频信号 的不可听性之间的理论关系 , 从而提出一种新的音频水印 嵌入策略 , 为折衷水印算法的不可听性和鲁棒性提供了一 种解决方法.
f
N -1
, 背景频率越大 ( DCT系数值越大 ), 嵌入信号的可见
性检测门限就越高 , 此系数的感觉容量就越大 . 2. 1 DCT 的噪声信号模型 在音频信号不同的 DCT 系数上嵌入水印对水印的鲁 棒性和不可听性有不同的影响 . 无论通过什么方法在 DCT 系数上嵌入水印 , 其最终影响都可认为是在 DCT 系数上 叠加一个噪声信号 . DCT 的解析形式如下 :
[ 6, 7]
, 把水印
放在 DCT域的中频系数上. 文献 [ 7]将中频系数定义为每 一段的第 2个 DCT 系数 , 从而将水印嵌入到音频载体信 号的中频系数上. 针对图像水印 , 黄继武等人
[ 8]
表示由 DCT域第 i 个点 ( 即 F (i )) 上的噪声信号 E (i ) 衍 生出来的对时间域第 n 个点 ( 即 f( n )) 的影响 . 式 (4) 可以写成下面的形式 , 即 e (i , n ) = 其中 cos t (i , n ) = cos (6) (2n + 1)i , i ≠0 2 N f 考虑噪声信号 E (i ) 对时间域序列 f 所形成的影响 e i , 即
收稿日期 : 20050712; 修回日期 : 20060328
[ 1, 2]
基金项目 : 国家自然科学基金 (N o.60173044); 教育部跨世纪优秀人才培养计划基金
第 7 期
马翼平 : DCT 域音频水印 : 嵌入对策和算法
1261
一 , 也是音频水印测评的重要技术指标. 从直观上讲 , 音频 信号的听觉质量随着水印嵌入强度的不同而不同 , 但我们 认为水印嵌入位置的不同也同样影响水印的不可听性 . 本文主要探讨 DCT 域音频水印的嵌入对策问题 : 在 DCT域 , 水印应放在哪里才足够鲁棒 在大多数早期的水 印算法中 , 为了保证水印的不可听性 , 在原始音频采样点 的最低有效位 (LSB ) 上嵌入水印 . 在 DCT域 , 与 LSB 方法 等效的做法是把水印嵌入到高频系数中. 这对音频水印载 体的听觉质量非常有利 , 但由于音频信号的高频区对常见 的信号处理和噪声比较敏感 , 这些算法所产生的水印鲁棒 性较差. 为提高鲁棒性 , Cox等人 提出水印应放在听觉 [ 4] 系统最重要的分量上 ( 对应于 DCT 域中的低频系数 ), 其理由是听觉上重要的分量是音频信号的主要成分 , 携带 较多的信号能量 , 在音频信号有一定失真的情况下仍能保 留主要成分. 因此 , 若水印嵌入到听觉重要的分量上 , 则鲁 棒性较好. 同时 , 为了保证不可听性 , 对听觉上重要的分量 的改变应小心进行
2 E (i )t (i , n ) N , i= 0
(5)
4
ei = ∑ e (i , n )
f
n =0
(7)
N- 1
2 DCT 系数的噪声敏感度
在音频信号中嵌入水印可视为在强背景下迭加一个 弱信号. 根据听觉系统的频率掩蔽 ( frequency m ask ing) 特 性
[ 9]
从而有 2 2 E (i )∑ t (i , n ) E (i )| t (i , n )| = n= 0 N n =0 N (8) 表示 F (i ) 上的噪声信号 E (i ) 对时间域序列 f 的影响. 2. 2 音频质量评价准则 作为性能指标 , 如何评价由于水印的嵌入而导致原始 ei = ∑
相关文档
最新文档