回声隐藏技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 绪论
1.1选题背景和研究意义
随着信息技术的进步和计算机网络的迅速发展,数字多媒体(数字图像、数字视频、数字音频等)的应用越来越广泛,并且可以方便地通过网络进行发布和传输。
然而利用公共网发布和传输数字多媒体,其便利性和不安全性是并存的。
通信双方相互传递的多媒体信息可以被第三方轻易地窃听、劫获,毫无隐私性可言;数字多媒体作品可以被盗版者低成本高速度的复制并传播。
因此,如何既充分利用数字化信息和计算机网络的便利,又能有效安全地实现版权保护和隐蔽通信,己受到人们的高度重视。
就是在这样的时代背景下,信息安全领域的.一项新技术—信息隐藏(information hiding)应运而生,并得到了迅速发展。
信息隐藏(Information Hiding)有时也称数据隐藏(Data Hiding)。
从广义上看,信息隐藏有多重含义[31:一是信息不可见,二是信息的存在性掩蔽,三是信息的接收方和发送方掩蔽,四是传输的信道掩蔽。
信息隐藏就是将秘密信息隐藏于另一非保密载体中,以不引起检查者的注意。
这里的载体可以是图像、视频、音频,也可以是信道,甚至是某套编码体制或整个系统。
信息之所以能够隐藏在多媒体数据中是因为:①多媒体信息本身存在很大的冗余性。
从信息论的角度看,未压缩的多媒体信息的编码效率是很低的,所以将这些秘密信息嵌入到多媒体信息中进行秘密传送是完全可行的,并不会影响多媒体信息本身的传送和使用。
②人眼或人耳本身对某些信息都有一定的掩蔽效应,比如:人眼对灰度的分辨率只有几十个灰度级,对边缘附近的信息不敏感。
利用人的这些特点,可以很好地将信息隐藏而不被察觉。
通常,信息隐藏与信息加密都是把对信息的保护转化为对密钥的保护。
信息隐藏不同于传统的密码学技术。
密码学技术主要是研究如何将秘密信息进行特殊的编码,以形成不可识别的密文进行传递;而信息隐藏则主要研究如何将某一秘密信息秘密隐藏于另一公开的载体中,然后通过公开载体的传输来传递秘密信息。
对加密通信而言,可能的监测者或非法拦截者可通过截取密文,并对其进行破译,或将密文进行破坏后再发送,从而影响秘密信息的安全;但对信息隐藏而言,可能的监测者或非法拦截者则难以从公开载体中判断秘密信息是否存在,难以截获秘密信息,从而能保证秘密信息的安全。
为了增加破译的难度,也可以把加密技术和隐藏技术相结合,即先对待嵌入对象进行加密得到密文,再把密文隐藏到载体对象中。
由此可见,传统的以密码学为核心技术的信息安全和隐藏式信息安全技术并不是互相矛盾、互相竞争的技术,而是互补的直到最近,信息隐藏技术与密码学相比,无论在研究领域还是工业应用中,都没有受到太大的注意,但是这一点在迅速改变,并且以信息隐藏为主题的第
一届学术会议于1996年组织召开。
其主要的推动力是对版权的关注,因为音频、视频和其它一些作品可以数字化形式出现,完美的复制品易于得到,导致大量未授权复制品的产生,这受到音乐、电影、图书和软件出版业的广泛关注。
1.2回声信息隐藏技术研究现状
作为一种新的网络环境中的信息安全技术,信息隐藏方法的研究及应用在学术和企业界备受关注,经过多年的努力,信息隐藏技术的研究己经取得了很大进展。
国际上先进的信息隐藏技术现在已经能做到:秘密信息可以嵌入到载体信号中进行安全地传输和提取,并且能够抵御一定程度的恶意攻击。
但总的来说,信息隐藏技术尚未发展到完善可实用的阶段,仍有许多技术性问题需要解决。
存在的问题
到目前为止,虽然一些较为有效的信息隐藏算法己经相继提出,但是实际的实现工程中还存在一些较为突出的问题,概括为以下几个方面:
(1)从实际应用的角度看,信息隐藏系统必然要在算法的鲁棒性、信息容纳能力以及不可感知性之间达到一个平衡,这涉及鲁棒算法的原理性设计、隐藏信息的构造模型、隐藏信息嵌入算法和检测算法的理论研究等方面。
如何在鲁棒性、信息容纳能力以及不可感知性相互矛盾的三方面都获得良好的性能仍然是一个难题。
(2)有些信息隐藏算法在提取隐藏信息时必须依靠原始载体信号,不能实现盲检测,这往往会限制信息隐藏算法在实际工程中的应用。
(3)目前,关于如何在图像文件中进行信息隐藏的研究很多,而针对音频信息隐藏的研究相对较少。
并且相对于在二维图像上实施的数字图像信息隐藏而言,音频是一维信号,人耳在接收时会随时间将声音信号全部输入大脑,同时由于人类听觉系统(HAS)比视觉系统(HVS)更为敏感,音频信号中可能存在的失真更易被察觉,这使得音频信息隐藏技术的设计更具有挑战性。
(4)针对基于音频的信息隐藏技术而言,同步问题是需要解决的关键问题之一。
声音信号作为时间轴上的一维信号,其采样点的数量通常在信号处理前后会发生变化,或者数据会发生位移。
因此,如何判别隐藏信息的嵌入位置成了正确提取隐藏信息的前提条件。
但在实际中,缺乏同步的算法对于裁剪、跳跃攻击等攻击的鲁棒性不强。
(5)语音是音频当中一种重要的信息载体。
语音信号频谱成分相对单调,频
宽有限,听觉上没有音乐“丰富”,隐藏能力相对较小。
因此,寻求适应语音信号的信息隐藏方法也是今后一个重要的研究方向。
(6)在数字图像和视频隐藏算法研究中,可以利用国际通行的标准样本进行测试,以确定算法的优劣和特点;但在数字音频信息隐藏中,还没有出现诸如图像“Lena”这样的标准测试样本,这给客观评价隐藏算法性能带来极大困难。
1.3本文研究思路和研究内容
针对原始音频对隐藏音频倒谱值的影响,介绍了Kim的前后项回声算法,在研究Kim、Foo,BinYan等人算法的基础上提出了一种利用PN序列改进前后向回声核的回声隐藏算法,回声核采用Kim等人提出的前后向回声核,实现结果表明,该算法提高了水印的安全性和不可感知性,具有较好的透明性和鲁棒性。
2回声信息隐藏技术的综述
回声隐藏技术(Echo Hiding)是由Bender等人在1996年最早提出来的一种基于音频的信息隐藏技术。
回声隐藏在原始声音中引入人耳不可感知的回声以达到信息隐藏的目的,具有许多优点:隐藏算法简单:算法不产生噪声,隐藏效果好;如果合适地选取衰减系数和延迟时间,有时由于回声的引入,会形成立体声效果,使声音听起来更加浑厚;提取隐藏信息时不需要原始音频数据,能够实现隐藏信息的盲检测。
描述了回声隐藏的基本原理和数学模型,叙述了十年来的国内外回声隐藏的研究现状,最后仿真实现了传统的回声隐藏算法。
2.1回声隐藏的基本原理
回声隐藏利用了人耳的听觉掩蔽效应,是一种有效的音频信息隐藏方法。
其目的是以添加回声的方式在原有音频信息中嵌入新信息,实现信息隐藏。
Bender 等人在文献中给出了回声隐藏的基本思想。
Bender等人提出的回声核如图2.1所示。
它的数学模型可以表示为
图2.1 典型的回声核脉冲
嵌入回声的声音可表示为和的卷积,和,分别为原始声音信
号和回声核的单位脉冲响应。
回声信号由引入到原始声音当中,其中,d为延迟时间,为衰减系数。
嵌入回声后的声音信号可以表示为
回声隐藏的具体方法是:对一段声音信号数据,先将其分成若干包含相同样点数的片段,每个片段时间约为几个到几十个ms,样点数记为N。
每段用来嵌入l比特隐藏信息。
在信息嵌入过程中,对每段信号使用,选择d=do,则在信号中嵌入隐藏信息比特“o”;选择d=d。
,则在信号中嵌入隐藏信息比特“1”。
延时瓯和d。
是根据人耳听觉掩蔽效应为准则进行选取的。
最后,将所有含有隐藏信息的声音信号段串联成连续信号。
嵌入信息的提取实际上就是确定回声延时。
由于每段隐写声音信号都是一个卷积性组合信号,直接从时域或频域确定回声延时存在一定困难,可采用卷积同态滤波系统来处理,将这个卷积性组合信号变为加性组合信号。
Bender等人用倒谱分析的方法来确定回声延时。
对声音信号,其倒谱描述如下
其中,F和叫分别表示傅立叶变换和傅立叶反变换。
这样可以表示为
这样可以将和的倒谱求和,即
其中,的倒谱为
式中
由于,又因衰减系则
因此,当回声核如式(3.1)所示时,嵌入回声后声音信号的倒谱可以表示为
2.2回声隐藏的嵌入方法概述
与其它音频信息隐藏方法(例如:LSB法,相位编码法,扩频调制法相比,回声隐藏具有以下许多优点:隐藏算法简单;算法不产生噪声,隐藏效果好,并且有时由于回声的引入,使声音听起来更加浑厚;对同步的要求不高,算法本身甚至可以做粗同步的工具;提取隐藏信息时不需要原始音频序列,能够实现盲检测。
但该方法的弱点也很明显,嵌入容量较小(一般秘密信息嵌入量为2b /s~64b/s,其大小与传输环境和参数设计有关),提取率不是很让人满意,而且信道噪声、人为篡改都会降低提取准确率。
总结十年来国内外对回声隐藏的研究进展情况,其嵌入算法的研究大部分集中在对“核”改造上,但也出现了一些具有指导意义的新方法。
1.基于多回声核的隐藏方法
不可感知性是包括回声隐藏在内的所有基于音频的信息隐藏理应具备的一个重要特性。
在回声隐藏实现过程中,所引入回声的幅度直接决定了隐藏信息的不可感知性。
Xu等人在Bender原始算法的基础上提出一种算法改进思路。
即用多回声核来引入多个小幅度回声来提高隐藏信息的不可感知性。
但是,面对第三方的恶意攻击,隐藏信息的恢复率并不理想,算法并不具备较强的鲁棒性。
2.基于双极性回声核的隐藏方法
Oh在文献中把人耳可感知的回声分为两部分echo和coloration。
前者由于引入的回声延迟时间过大,影响听觉质量;后者听觉上可理解为对原始声音的赋色。
Oh研究了在赋色域嵌入不同极性和个数的回声信号对原始声音所产生的影响。
不同极性是针对式(3一1)或图3.1中口的符号而言的。
若口为正数则称回声为正极性;若口为负数则称回声为负极性。
不同极性和个数的回声信号的频率响应是不同的。
在音频信号中嵌入两个极性相反、不同延时的回声,能够增强回声的不可感知性。
Huang发展了Oh的方法,提出了一种基于心理声学模型(Psychoacoustic model MPEG.1)分析的回声隐藏方法,进一步提高了算法的鲁棒性和回声的不可感知度。
但是这类方法仍然存在缺陷:隐藏信息的恢复率较低,特别是引入回声幅度较小的时候。
3.基于双向回声核的隐藏方法
Kim提出了一种新的回声“核”。
该回声核由两个延时时问相同,但是方向相反的回声引入因子构成,称为前后向回声核,它可以表示为
其中称后向回声引入因子,称前向回声引入因子。
Kim的研究结果表明,利用倒谱分析检测隐藏信息时,对应回声位置的峰值大小受三个因素的影响:①起最大决定作用的是回声核的倒谱响应;②原始声音信号的倒谱响应同样影响峰值大小;③延迟时间d的方向对峰值大小的影响也不容忽
视。
针对相同的原始声音信号,采用前后向回声核的隐藏算法在保证良好不可感知性的前提下能够获得较低的隐藏信息检测的误码率。
4.基于时域扩展型的隐藏方法
Ko等人提出了一种时域扩展型回声隐藏技术,它将一个PN序列作为一个回声核的一部分,利用PN序列将引入的回声在时域均匀扩展
其中为一个冲激函数,口为衰减系数,回声延迟d为do或d。
,根据嵌入隐
藏信息位是“0”还是“l”。
p(n)是长度为L,幅度为±l的PN序列,可表示为
p(n)序列具有一个重要的扩展性质
这实际上是一种倒谱域的扩频方法,水印检测过程包括在倒谱域对回声核进行相关检测。
此方法可以有效地抵制盲移除攻击,并且在引入回声幅度较小的前提下,可获得较高的恢复率,缺点是算法较为复杂,运算量大。
Chou等人在单边时域扩展型回声隐藏技术基础上,提出了双边时域扩展核,通过将PN序列分别引入前向回声核和后向回声核中,其中,回声核脉冲可以表示为
这个方法提高了隐藏信息的恢复率,增加了抵抗各种攻击的鲁棒性。
5.基于衰减系数的隐藏方法
赵朝阳在文献中提出了一种通过调整衰减系数来达到隐藏信息的回声隐藏方法。
对于样点数为Ⅳ,回声延时为d的音频段,引入衰减系数为的回声后声音信号则的方差为
其中为的均值,。
随衰减系数a的变化而变化,取一个
方差的参考值过适当选择大小可使为要嵌入的1比特(o 或1)信息。
隐藏信息的提取与嵌入过程相似,即先计算的方差再由
来确定嵌入的1比特信息。
实验结果表明,只要选择低于特定
的阀值,在未受攻击的情况下,该方法数据恢复率可达100%,对较小随机噪声的攻击方法具有一定的免疫力。
而在隐写信号经过滤波、重采样和有损压缩等方法处理后,数据恢复率没有明显的改善。
6.基于自适应调整嵌入强度隐藏方法
慧琴等人提出基于心理声学模型设计二维模糊控制器,SMR和掩蔽阀值作为输入,由输出控制衰减系数口的值;利用神经网络的非线性映射能力确定回声内核的幅值,避免了复杂的心理声学模型的计算过程。
都实现了水印嵌入强度的自适应,提高了隐藏算法的鲁棒性和不可感知性。
7.其他方法一
检测是回声隐藏的显著特点,即在没有任何先验知识的前提下通过倒谱分析即可检测到回声的位置,为隐藏信息的提取提供了便利。
同时,也给恶意攻击以可乘之机。
回声盲移除技术在文献中得到了很好的论述。
Foo等人提出了一种基于内容自适应的回声嵌入方法,首先,检测各分帧的能量,仅仅那些帧的能量在域值之上的才嵌入水印,衰减系数通过心理声学模型和感知滤波器来达到自适应的更改。
这个方法能较大地提高隐藏信息的恢复率。
Cho等人提出了一种基于小波变换的回声嵌入方法,将音频信号通过小波变换划分成不同频率的子带信号,在子带信号中iJIA.回声信息。
该方法可以增加嵌入信息量,并具有较高的鲁棒性。
BinYan针对同步破坏(desynchronization)这一攻击方法,提出了一种基于模拟退火算法的回声隐藏算法,提高了算法的鲁棒性。
Huang等人提出对隐藏信息先利用纠错码编码后作为水印信号【4l】,再嵌入音频信号中。
该方法降低了检测信息的误码率,进一步提高隐藏算法的抗攻
击能力;提高了信息隐藏的可靠性。
但会降低嵌入数据量。
Chen Nin[421等人提出了一种基于回声隐藏的多重水印算法,即一段音频多次以不同的延迟嵌入回声。
该算法可以实现多重水印的盲提取,对各种常规信号处理操作和恶意攻击都具有很强的鲁棒性。
2. 3回声隐藏的提取算法概述
1.早期的提取算法
为检测回声中隐藏的信息,需要检测回声的延迟时间。
早期的回声检测方法包括自相关法、倒谱分析法等。
通过求取隐写信号的自相关函数的方法来确定回声位置的方法最为简单,但是提取效果最差。
常用的检测方法是倒谱分析。
从声音信号的复倒谱域来确定回声位置,是最经典的回声隐藏检测方法。
但是由于复倒谱由幅度和相位组成,计算相对来说较为复杂。
而使用同样捌有解卷积性质的实倒谱仅仅具有幅度部分,不仅计算方便,而且“核”的倒谱具有和复倒谱相同的特征。
Bender等人在文献中采用倒谱自相关(Autocepstrum)来检测回声,取得了更好的效果。
2.提取算法的改进
赵朝阳等对Bender提出的提取算法进行了改进。
在进行回声检测时,用指数序列先加权隐写声音信号只要足够小,可使
为最小相位序列,然后计算的复倒谱通过比较在d
和d.处的取值,可确定隐藏的信息比特。
对于一般混合相位序列,在计算复倒谱时,为减少混叠,需要通过附加零点扩大序列的处理空间,再进行耗时的离散傅立叶变换。
这样显然将大大地降低数据恢复的速度。
将隐写声音信号指数加权,变成最小相位序列,然后再求复倒谱,可简化计算,提高精度。
Bin Yan在文献㈣利用“功率倒谱(Power Cepstrum)”来检测回声位置。
声音信号的功率倒潜可以表示为
与传统的倒潜分析法相比,功率倒谱中与回声位置对应的峰值更为明显,特别是当原始声音信号中存在静音间隔时,该方法更为适用。
3基于PN序列的改进前后向回声核隐藏算法
3.1引言
运用倒谱分析法对于嵌入式回声延迟及相应的水印进行检测后,发现尽管传统的回声隐藏(Echo Hiding)系统有许多优势,但也存在的相应的安全问题。
比如传统的回声隐藏系统在安全方面没有使用任何对称密钥或公共密钥,其解码器相对来说比较自由且可能被任何未经授权的接收器探测到其水印位,因此传统的回声隐藏系统在鲁棒性上比较差。
本章首先介绍了Kim的前后项回声算法,在研究Kim、Foo,BinYan等人算法的基础上提出了一种利用PN序列改进前后向回声内核的回声隐藏算法,回声核采用Kim等人提出的前后向回声核,实现结果表明,该算法提高了水印的安全性和不可感知性,具有较好
的透明性和鲁棒性。
3.2Kim的前后向回声算法
Kim的前后向回声核形式如下
其简单形式可以用下式
图3.1前后向回卢核脉冲
从上式可以看出,倒潜的第一个尖峰在n=d处,其幅度值为
近视等于明显大于传统回声核在,z=d处
得到的峰值幅度。
3.3基于PN序列的改进前后向回声核隐藏算法
在对前述Kim等人所提出的方法综合分析实验的基础上,根据双边时域扩展思想,本章提出了一种基于PN序列的改进前后向回声核隐藏算法,该算法有别于传统的时间域嵌入一倒谱域提取,水印的嵌入和提取均在时间域完成,能够在回声幅度很小的情况下保持高检测率:使用PN序列对回声内核的改进提高了水印的安全性和不可感知性。
1算法的描述
Kim的前后向回声核形式如式
其简单形式可以表示为
图3.2前后向回声核
通过将PN序列分别引入前向回声核和后向回声核中,利用PN序列将引入的回声在时域均匀扩展。
可表示为
下图3.3为某一段音频信号的回声嵌入过程,它直接利用回声内核h(n)与x(n)做卷积完成嵌入。
本算法对回声内核进行了改进,用PN序列中的l和0分别控制h(n)里衰减系数的正负,如图3.4所示。
此时,嵌入过程就不是简单的移位相加,假设PN序列的长度与回声的长度相同,那么依照图3.4中的对应规则,图3.3中表示回声的每一位数据都被添加了正负号,然后再与音频载体进行叠加,完成嵌
入过程。
图3.3一段音频信号的嵌入过程
图3.4使用PN序列对回声内核的改造
3.4实验结果分析
1.嵌入前后音频波形分析
实验选取长度为86秒的一首.way格式流行歌曲为嵌入音频载体。
其采样频率为44.1KHZ,量化精度为16bit,单声道音频。
采用长度N=2421(采样点)的矩
形窗对原始声音分段,回声延迟分别取100和150个采样点代表嵌入“O”和“1”。
隐藏水印为图3.5所示的bmp格式,名为“Niupt”、像素为56X 56的一幅二值图像。
首先用传统回声隐藏的方法对音频信号进行水印嵌入,然后,用改进后的算法重新完成水印嵌入,并比较载体信号和分别用两种方法加入水印的音频载体信号前lO帧的波形图,
图3.5隐藏水印
图3.6嵌入水印前后音频波形比较
在图3.6中可以看出,经过改进后的算法产生的含水印信号的波形与原始载体的波形较为相似,而使用传统回声隐藏算法产生的含水印信号的波形则产生了失真,主要表现在信号波形的峰值增加,嵌入水印后的声音听起来更加浑厚,噪声干扰表现的比较明显。
用归一化相关系数来衡量对音频信号改动后的变化情况,经过传统回声隐藏算法嵌入水印的载体信号与原始载体的归一化相关系数为0.9365,而改进算法嵌入水印后的载体信号与原始载体的归一化相关系数为0.9885。
2.主观感知性测试
为了测试采用不同算法嵌入隐藏信息后的声音信号感知质量,有十五名无专业音乐背景的学生对嵌入隐藏信息的声音信号进行五级平均意见打分,综合得分为3.53分,说明该算法具有较好的透明性,
表3.7主观测试结果
3.鲁棒性测试
为-fN试算法的鲁棒性,对含有隐藏信息的声音信号采取不同程度的信号处理和攻击
手段如下:加噪、滤波、重采样、重量化、MP3有损压缩、剪切。
如表3.8显示了嵌入隐藏信息的声音信号遭受下述音频处理或攻击后检测提取二值图像。
加噪:对信号添加均值为零的白噪声,信噪比SNR=20 dB。
此时已经明显感觉噪声的存在,声音信号听觉质量变得很差。
滤波:使信号通过截止频率为lkHz的Butterworth低通滤波器。
重采样:利用11.02KItz的采样频率对声音信号重新采样。
重量化:将声音信号的量化精度由原来的16bit变为8bit。
有损压缩:采用目前常用的MP3压缩编码,压缩比例为12.5:1,然后进行相应解码,对解码后的声音信号进行隐藏信息检测提取。
剪切:为了测试算法对抗裁剪攻击的效果,将嵌入隐藏信息的声音信号开始裁剪掉2500个采样点,然后进行隐藏信息的检测提取。
其中,A为传统回声隐藏方法的提取效果;B为有PN序列改进回声核后回声隐藏方法的提取效果;
表3.8(a)隐藏二值图像的提取效果。