音频信息隐藏技术及其发展方向_戴跃伟

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文章编号:1002-0411(2001)05-385-07

音频信息隐藏技术及其发展方向

戴跃伟 茅耀斌 王执铨 杨 洋

(南京理工大学自动化系 210094)

摘 要:音频信息隐藏技术已成为近年来的研究热点之一.利用该技术可在音频文件中嵌入秘密信息以达到“掩蔽通信”和“版权保护”等目的.本文首先介绍了音频信息隐藏的一些基本问题,如人类听觉系统模型、音频文件格式、声音传送环境及对音频信息隐藏的基本要求等等.随后重点研究了迄今为止已出现的一些音频信息隐藏技术的工作原理及其局限性.最后指出该研究领域未来的研究和发展方向.⒇

关键词:音频信息;信息隐藏;水印技术;隐秘通信

中图分类号:T P14 文献标识码:A

AUDIO INFORMATION HIDI NG TEC HNIQUES A ND ITS

FUTURE DIRECTIONS

DAI Yue-w ei M AO Yao-bin W AN G Zhi-quan Y AN G Yang

(Depa rtment of Automation,N anjing Un iversity of Science an d Tech nology 210094)

Abstract:Audio infor matio n hiding technique ha s beco me o ne of the resear ch ho tspo ts in recent y ears.

W ith such techniques w e may embed secr et info rma tio n into a udio files,so as to g et`cov et comm unication’

a nd`copy rig ht pr otectio n’etc.At fir st,this paper describes some basic items as h uma n auditor y system,

fo r ma ts of audio file,tr ansmission e nviro nments o f audio sig nal,and some ba sic r equir ements fo r a udio info r-ma tio n hiding as w ell.Th en it focuses o n the principles a nd limita tio ns of tho se a udio info rmation-hiding techniques pr esented so far.At last it points out some pr omising directions in this r esea rch area.

Keywords:audio infor matio n,info rma tion hiding,wa ter ma rking tech nique,cov er t communicatio n

1 引言(Int roductio n)

1.1 概况

20世纪90年代以来,计算机网络技术和多媒体信息处理技术在全世界范围内得到了迅猛发展.数据压缩和多媒体技术的发展,使得人们能够方便快捷地制作、加工、分发和传送各种多媒体制品,如数字化音乐、图像、影视等方面的作品.而且这种复制和传送可以无损地进行.但是,网络在给人们带来便利的同时也暴露出越来越严重的安全问题.例如:多媒体作品的版权侵犯;软件或文档的非法拷贝;电子商务中的非法盗用和篡改;网络中信息的非法截取和查看;甚至黑客攻击等等.毫无疑问,网络中的信息安全问题是现在乃至未来相当长时期内的研究热点之一.

近年来出现了一个新的研究方向——信息隐藏技术研究.该技术与密码技术之不同点在于:前者隐藏信息的“内容”而后者则隐藏信息的“存在性”.该技术的出现,无疑会给网络化多媒体信息的安全保存和传送开辟一条全新的途径.事实上,信息隐藏技术的理论和算法研究已引起了众多知名研究机构如麻省理工学院的多媒体实验室、剑桥大学的多媒体实验室、IBM数字实验室等的极大重视.而实用化研究也已在进行之中,已有多家公司相继推出了在数字化图像、音频和视频作品中嵌入鲁棒水印以进行版权保护的软件产品,如Bluespike公司的`Gio-v anni数字水印系统’,Cog nicity公司的`Audio key M P3水印系统’,Sig num Tech nologies公司的`Suresign水印’等等.

近年来音频信息隐藏技术的研究工作发展速度很快,尤其在变换域音频信息的数据嵌入技术,由于其能将信息嵌入到载体的敏感区域,使得研究更具有实用性.本文对当前数字化音频信息隐藏技术的

第30卷第5期2001年10月 信息与控制

Infor matio n a nd Contr ol

V ol.30,No.5 

 Oct.,2001 

⒇收稿日期:2001-02-08

研究现状做一些总结和分析对比,并进一步指出未来的研究发展趋向.

1.2 人类听觉系统模型(HAS-Human Audio Sy stem)

在音频文件中嵌入数据的各种方法都要利用人类听觉系统的某些特性,即人的听觉生理-心理特性[1,2].

首先,人的听觉具有屏蔽效应.弱音会被强音所淹没而产生听觉屏蔽现象.听觉屏蔽取决于屏蔽者与屏蔽对象的幅值与时域特性,可分为频域屏蔽和时域屏蔽.

频域屏蔽是指听觉信号中,若两个信号的频率相近,那么较强的信号将使弱者变得不可听见.频率屏蔽模型可以很方便地从当代高质量音频编码技术中获得.时域屏蔽比较直观,它是指强音和弱音同时或几乎同时出现时,强音屏蔽弱音的现象.时域屏蔽包括前屏蔽与后屏蔽.前屏蔽是指在强的屏蔽音出现前,被屏蔽音不可听见.后屏蔽是指在强屏蔽音消失后,被屏蔽音不可听见.

其次,人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感.

第三,人耳对不同频段声音的敏感程度不同[8,9],通常人耳可以听见20Hz~18k Hz的信号,但对2KHz~4k Hz范围内的信号最为敏感,幅度很低的信号也能被听见,而在低频区和高频区,能被人耳听见的信号幅度要高的多.即使对同样声压级的声音,人耳实际感觉到的音量也是随频率而变化的. 1.3 音频文件格式

对高质量数字音频的描述样本最流行的格式是16比特线性量化,如:Windo w s中的W AV格式音频文件和AIFF音频交换文件格式.另一种对较低质量声音的流行版本是采用8比特μ律的对数分度.这些量化方法使信号产生了一些畸变,在8比特μ律中显得更为明显.

一般声音的流行采样频率包括8k Hz,9.6kHz, 10k Hz,12kHz,16k Hz,22.05k Hz和44.1kHz.采样频率影响数据隐藏因为它给出了可用频谱的上限(如果信号的采样频率为8kHz,则引入的修改分量的频率不会超过4k Hz).对于大多数已有的数据隐藏技术而言,可用的数据空间与采样频率的增长至少呈线性关系.

最后需要考虑的是由有损压缩算法(如ISO M PEG-AUDIO)引起的变化.这些变化彻底改变了信号的数据结构;它们仅仅保留了听者能感觉到的特性部分,也就是说,它听起来与原来的相似,即使信号在最小平方意义上完全不同.

1.4 声音传送环境

一个数字格式的音频文件可在多种环境中传送.文[6]中描述了几种可能的形式.第一种为无损传输,即信号是在未作修改的环境中传送的,因此相位和幅值都没改变.在第二种情况为重新采样,信号以更高或更低的采样率重新采样,未改变相位和幅值,但改变了时域特性.第三种情况是将信号转换成模拟的形式来传送.在这种情况下,即使认为模拟线路是无干扰的,相位、幅值和采样率都改变了.最后一种情况是当环境是有干扰的,信号将是非线性地被传送,从而导致相位和幅值改变,以及回声等.

1.5 对音频信息隐藏的要求

要想成功地在数字音频媒体中隐藏数据,须关注以下几方面的要求:

(1)对数据变换处理操作的鲁棒性.这就要求水印本身应能经受得住各种有意或无意的变换(攻击).典型的变换有叠加噪声、数据压缩、滤波、重采样、几何变换、统计攻击等等.

(2)知觉相似性.数字水印是在对象中嵌入一定量的隐蔽信息,为使得第三方不易察觉这种嵌入信息,需谨慎选择嵌入方法使嵌入信息前后不产生可感知的变化.这种知觉相似性在理论上可用“知觉相似性函数”Sim(x,y)来描述.数字音频中两个信号的相关性函数可被用作相似性函数.

(3)是否需要原始数据进行信息提取.根据数据嵌入和提取方案的不同设计,有些方案可以不需要借助于原始数据进行信息提取,这一性能将影响方案的用途和性能.

(4)提取误码率.低数据提取误码率也是音频水印方案中的一个重要技术指标.因为一方面存在来自物理空间的干扰,另一方面信道中传输的信号会发生衰减和畸变,再加上人为的数据变换和攻击.

(5)嵌入数据量指标.根据用途的不同,在有些应用场合中须保证一定的嵌入数据量.

2 经典的音频信息隐藏技术(Classical au-dio info rmation hiding techniques)

迄今为止,在数字音频文件中嵌入数据的方法主要有以下四种:①最不重要位方法;②扩展频谱方法;③相位编码方法;④回声编码方法.分别叙述如下.

2.1 最不重要位(LSB)方法

386信 息 与 控 制30卷 

相关文档
最新文档