音频水印PPT

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图13.2 “音高-频率”曲线


(3) 掩蔽效应
一种频率的声音阻碍听觉系统感受另一种频率的声音,这种现象 称为听觉掩蔽效应。前者称为掩蔽声音,后者称为被掩蔽声音。 听觉掩蔽取决于屏蔽声音与被掩蔽声音的幅值与时域特性,可分 为频域掩蔽和时域掩蔽。 频域掩蔽是指听觉信号中,若两个信号的频率相近,那么较强的 信号将淹没较弱的信号。实验证明低频信号可以有效地掩蔽高频 信号,但高频信号对低频信号的掩蔽作用不明显。在当代高质量 声音编码技术中就使用了频率掩蔽模型。 时域掩蔽比较直观,它是指强音和弱音同时或几乎同时出现时, 强音屏蔽弱音的现象。时域掩蔽包括超前掩蔽与滞后掩蔽。超前 掩蔽是指在强掩蔽声音出现前,被掩蔽声音不可听见。滞后掩蔽 是指在强掩蔽声音消失后,被掩蔽声音不可听见。产生时域掩蔽 的主要原因是人的大脑处理信息需要花费一定的时间。一般来说, 超前掩蔽大约只有5~20ms,而滞后掩蔽可以持续50~200ms。


(6) 人类听觉系统对声音文件中附加的随机噪 声敏感,并能觉察出微小扰动。 (7) 人类听觉系统有很大的动态范围及较小的 分辨范围,HAS能察觉到大于100,000,000:1的 能量,也能感觉大于1000:1的频率范围,对加 性随机干扰也同样敏感。可以测出音频文件中 低于1/10,000,000(低于外界水平80dB)的扰动。 因此,较大的声音可屏蔽较小的声音。
同的两个概念,但它们之间又有一定的联系。


当声音弱到人耳刚刚可以听见时,称此时的声音强度 为“听阈”。例如,1KHz纯音的声强达到时,人耳刚 能听见,此时的客观响度级定义为零dB声强级,而主 观响度级定义为零方。另一种极端的情况是声音强到 是人耳感到疼痛,我们称这个阈值为“痛阈”。例如, 当频率为1KHz的纯音声强达到120dB左右时,人耳感 到疼痛,此时主观响度级为120方。实验表明,“听阈” 和“痛阈”都随频率变化。图13.1说明了人耳对响度 的感知随频率变化的特性。图中最上面的一条曲线是 “痛阈”随频率变化的曲线,最下面的一条曲线是 “听阈” 随频率变化的曲线,这两条曲线之间的区域 就是人耳的听觉范围。由图13.1可见,1KHz的10dB的 声音和200Hz的30dB的声音,在人耳听起来具有相同 的响度。




(4) 对于频域信号中的相位分量和幅值分量, 人耳对幅值和相对相位更为敏感,而对绝对相 位不敏感。 (5) 人耳对不同频段声音的敏感程度不同,通 常人耳可以听见20Hz~18KHz的信号,对 2KHz~4KHz范围内的信号最为敏感,在此范围 内幅度很低的信号也能被听见,而在低频区和 高频区,同样低幅度的信号就可能无法被听见。 即使对同样声压级的声音,人耳实际感觉到的 音量也是随频率而变化的。
设计一个水印系统满足以上全部要求是很困难的。有些性质如鲁 棒性、透明性和数据容量之间是相互矛盾的,因此,在这些要求 中寻找最佳平衡是水印系统设计的目标。
13.1音频水印特点

在音频中加入水印,要考虑到音频载体 信号的在人类听觉系统、音频格式以及 传送环境等方面的特点。与图像和视频 相比,音频信号在相同的时间间隔内采 样的点数少。这使得音频信号中可嵌入 的信息量要比可视媒体也要少。并且由 于人耳听觉系统(HAS)要比人眼视觉系统 (HVS)敏感得多,因此听觉上的不可知觉 性实现起来要比视觉上困难得多。
一个好的音频水印算法应该具备如下性质: (1) 水印必须嵌入到宿主音频数据中,否则很容易被修改或除去。 (2) 水印必须具有感知透明性,即不能对原始音频的质量产生明显的影响。 (3) 为保证水印的安全性,一般在嵌入过程和检测过程中要使用密钥。 (4) 水印应该对 MP3 有损压缩、低通滤波、噪声、重采样等音频信号处理具 有鲁棒性。 (5) 嵌入和检测的计算代价要足够小以进行实时处理。 (6) 在大多数情形下,水印检测不应该需要原始音频,即进行盲检测,因为 寻找原始音频是十分困难的。 (7) 水印算法最好是公开的,即安全性应依赖于密钥的选择而不是对算法进 行保密。
13.1.1人类听觉系统 (HAS-Human Auditory System)

人耳的机理相当复杂,它就像一个频率分析仪,能够 探测到从10Hz至20000Hz的声音。描述人类听觉系统 的感知特性一般从下面三个方面来分析:响度、音高 和掩蔽效应。
(1) 对响度的感知 声音的响度即声音的强弱。在物理上,声音的响度使用客观测量 单位来度量,即声压单位(达因/平方厘米)或声强单位(瓦特/平 方厘米)。在心理上,主观感觉的声音强弱使用响度级“方(phon)” 或“宋(sone)”来度量。这两种感知声音强弱的计量单位是完全不
图13.1 人耳对响Hale Waihona Puke Baidu的感知随频率变化的曲线


(2) 对音高的感知 客观上用频率来表示声音的音高,单位为Hz。 而主观感觉的音高单位则是“(美)”。它们也是 两个不同又有联系的概念。主观音高与客观音 高的关系可用下式表示。 人耳对响度的感知有一个从听阈到痛阈的范围, 对频率同样也有一个感知范围。人耳可以听见 的最低频率约为20Hz,最高频率约为18000Hz。 图13.2就反映了人耳对响度感知能力随着信号 频率变化的规律。
第十三章 音频水印

13.1音频水印特点 13.2音频水印算法评价标准 13.3音频水印分类及比较 13.4 DCT域分段自适应音频水印算法实例 13.5小结


互联网技术的迅速发展和音频压缩技术的日益成熟使 得以MP3为代表的网络音乐在互联网上广泛传播。但 是,肆无忌惮的复制和传播盗版音乐制品使得艺术作 品的作者和发行者的利益受到极大损害。在这种背景 下,能够有效地实行版权保护的音频数字水印(Digital Audio Watermarking)技术变得越来越重要,已成为一 个十分热门的研究领域。 数字音频水印技术将具有特定意义的信息嵌入到原始 音频中而不显著地影响其质量。根据不同的应用,嵌 入的水印数据可以是版权信息、序列号、文本(如音乐 或艺术家的名字)、一个小的图像甚至是一小段音频。 水印隐藏在宿主音频数据中通常不为人所感知,此外 还必须能够抵抗常规音频信号处理以及某些恶意的攻 击。
相关文档
最新文档