信息隐藏技术 考试要点整理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息隐藏技术术语
□信息隐藏是利用人类感觉器官对数字信号的感觉冗余,将一个信息(秘密信息)隐藏在另一个公开信息(载体)中,信息因此而受到保护.
□秘密信息: 版权信息、秘密数据、序列号
□载体信息: 图像、视频、音频、文本
□信息隐藏方法的最大特点是:除了被通知的有关方面以外的任何人都不知道秘密信息存在这个事实。

信息隐藏与传统密码技术关系 ( 隐藏 vs 加密 )
□传统加密技术的局限性
□明确提示攻击者哪些是重要信息,容易引起攻击者的好奇和注意,并有被破解的可能性,而且一旦加密文件经过破解后其内容就完全透明了□攻击者可以在破译失败的情况下将信息破坏
□加密后的文件因其不可理解性也妨碍了信息的传播
□随着电脑硬件的迅速发展,破解技术日益成熟
□信息隐藏与密码技术的关系
密码技术仅仅隐藏了信息的内容,而信息隐藏不但隐藏了信息的内容而且隐藏了信息的存在
信息隐藏技术分类【填空】
信息隐藏:数字水印(脆弱水印、稳健水印(可见水印、不可见水印)、潜信道、叠像术、信息伪装(语义伪装、技术伪装)
信息隐藏技术的应用
□在Web网上对授予著作权的资料进行自动监控
□数据保密(防止非法用户的截取与使用)
□数据完整性的验证(确认数据在网络传输中是否被篡改过)
□边缘信息的嵌入 (扩充数据 - 包括对主信号的描述或参考信息、控制信息以及其它媒体信号等。

)
□电子证件/票据防伪
二章、信息隐藏技术概论
信息隐藏的概念
□信息隐藏是把一个有意义的信息(秘密信息)隐藏在载体信息中得到隐蔽载体。

非法者不知道这个普通信息中是否隐藏了其它的信息,而且即使知道也难以提取或去除隐藏的信息。

□载体可以是文字、图象、声音及视频等。

为增加攻击难度,可先对消息M加密得到密文消息M’,再把M’隐藏到载体C中。

□信息隐藏技术主要由两部分组成: (1)信息嵌入算法(嵌入器) ,它利用密钥来实现秘密信息的隐藏。

(2)隐蔽信息检测/提取算法(检测器) ,它利用密钥从隐蔽载体中检测/恢复出秘密信息。

信息隐藏的分类
□按载体类型分为:文本、图像、声音和视频信息隐藏技术
□按密钥分为:若嵌入和提取采用相同密钥,则称其为对称隐藏算法,否则称为公钥隐藏算法
□按嵌入域分为:空域(时域)方法及变换域方法
□按提取的要求分为:若在提取隐藏信息时不需要利用原始载体,则称为盲隐藏;否则称为非盲隐藏。

□按保护对象分为:隐写术和水印技术
–隐写术的目的是:在不引起任何怀疑的情况下秘密传送消息,
–因此它的主要要求是:不被检测到和大容量等。

★数字水印是指嵌在数字产品中的数字信号,可以是图像,文字,符号,数字等一切可以作为标识和标记的信息,其目的是进行版权保护、所有权证明、指纹(追踪发布多份拷贝)和完整性保护等。

信息隐藏技术特点
□透明性: 利用人类视觉或听觉系统属性,经过一系列隐藏处理,使目标数据没有明显的降质现象,而隐藏的数据却无法人为地看见或听见。

★鲁棒性: 指不因载体文件的某种改动而导致隐藏信息丢失的能力。

这里所谓"改动"包括传输过程中的信道噪音、滤波操作、重采样、有损编码压缩、D/A或A/D转换等。

□不可检测性:指隐秘载体与原始载体具有一致的特性。

如具有一致的统计噪声分布等,以便使非法拦截者无法判断是否有隐蔽信息。

□安全性(security):指隐藏算法有较强的抗攻击能力,即它必须能够承受一定程度的人为攻击,而使隐藏信息不会被破坏。

□自恢复性: 由于经过一些操作或变换后,可能会使原图产生较大的破坏,如果只从留下的片段数据,仍能恢复隐藏信号,而且恢复过
程不需要宿主信号。

数字水印技术
□数字水印(Digital Watermark)定义:(见上面★)
–将数字水印嵌于一个宿主载体中,但不被觉察到或不易被注意到,而且不影响宿主载体的知觉效果和使用价值,它可以是图像、声音、文字、符号和数字等一切可以作为标记和标识的信息。

–数字水印技术利用数字产品的信息冗余性,把与多媒体内容相关或不相关的标识信息直接嵌入多媒体内容中,通过对水印的检测和分析保证数字信息的完整可靠性,从而成为知识产权和数字多媒体防伪的有效手段。

数字水印与信息隐藏的联系和区别
□联系
–信息隐藏技术包括数字水印技术
–数字水印技术要将水印嵌入到载体中,就需要用到信息隐藏的算法,把水印隐藏到载体中
–两者都要求不可感知性
□区别
–信息隐藏技术侧重于隐藏容量,对隐藏容量要求较高,而对鲁棒性要求不高; 数字水印技术侧重于鲁棒性
–信息隐藏技术主要应用于隐蔽通信,而数字水印技术主要应用于版权保护和内容可靠性认证
数字水印技术分类
□按外表划分: 可感知和不易感知水印
□按嵌入技术划分:空域水印、变换域水印和压缩域水印
□按应用划分:鲁棒和脆弱(半脆弱)水印
(版权保护)鲁棒性数字水印主要用于在数字作品中标识著作权信息,如作者、作品序号等,它要求嵌入的水印能够经受各种常用的编辑处理(内容认证)脆弱水印主要用于完整性保护,与鲁棒性水印的要求相反,脆弱水印必须对信号的改动很敏感,人们根据脆弱水印的状态就可以判断数据是否被篡改过。

□按水印的载体上分: 图像水印、音频水印、视频水印、文本水印、软件水印数字水印技术分类【简答】
□按检测过程分:盲水印(公开)、非盲(私有)水印、半盲(半私有)水印
□非盲水印在检测过程中需要原始数据,而盲水印的检测只需要密钥,
不需要原始数据。

□按水印的内容划分:有意义水印和无意义水印。

□有意义水印是指水印本身也是某个数字图像或数字音频片断的编码;
无意义水印则只对应于一个序列号。

□有意义水印的优势在于,如果由于受到攻击或其它原因致使解码后的
水印破损,人们仍然可以通过视觉观察确认是否有水印。

□按密钥划分:私钥(对称)和公钥(非对称)水印
□按用途划分: 票据防伪水印、版权保护水印、篡改提示水印和隐藏标
识水印。

数字水印技术特点
–安全性:数字水印的信息应是安全的,难以篡改或伪造,同时,应当
有较低的误检测率。

–隐蔽性:数字水印应是不可知觉的,而且应不影响被保护数据的正常
使用,不会降质。

–鲁棒性:是指在经历多种无意或有意的信号处理过程后,数字水印仍
能保持部分完整性并能被准确鉴别。

–水印容量:嵌入的水印信息必须足以表示多媒体内容的创建者或所有
者的标志信息,或购买者的序列号,这样有利于解决版权纠纷,保护数
字产权合法拥有者的利益。

鲁棒水印特点
□透明性。

水印在通常或特定视/听觉条件下不可感知;
□安全性。

未经授权者很难检测出水印,经授权者能很快地提取出水印;
□鲁棒性。

水印信号在经历多种无意或有意的信号处理后,仍能保持完
整性或仍能被准确鉴别的特征;
□无二意性。

提取的水印能够证明版权所有者,不会引起争议;
□实时操作性。

在保证水印基本性能的同时,水印算法尽可能计算复杂
度低,便于操作。

脆弱水印特点
□不可见。

即嵌入水印后的数字多媒体数据必须要有很高的峰值信噪比
□具有篡改证明能力。

即必须对传输数据的篡改非常敏感
□受到篡改后能自动移除水印。

□检测时不需要原始图像。

数字水印的设计要求
□透明性(不可感知性):指水印应该是不可感知的,或者可见但其存在
不会影响到作品受保护。

□鲁棒性:指在经过常规的操作或恶意攻击后仍能检测到水印的能力。

常规操作:信号处理、几何失真等。

一般来说,水印应当对噪声、D/A、
A/D转换、重采样、量化、旋转、剪切、缩放等常规操作具有鲁棒性。


意攻击:指任何意在破坏水印的行为,包括非授权去除、非授权嵌入、
非授权检测等。

水印应该保证可以在一定程度上抵抗这些恶意攻击。


印必须很难被移除(理想状态为不可移除),若有人试图强行移除或破坏
水印,应该保证在水印被破坏前图像质量已经严重下降。

□脆弱性:具有与鲁棒性相反的特点。

例如用于真伪鉴别的水印,体现
了水印的安全性。

□通用性:一个好的水印算法应该适用于各种数字媒介。

□不可检测性:指隐藏对象与载体对象需具有一致的特性,以便使检测
分析变困难。

□高数据容量:水印能够包含相当的数据容量,以满足多样化的需要。

□高检测可靠性:水印的检测必须可靠,虚警率和漏检率很小。

虚警率指在没有水印的情况下检测出水印的概率;
漏检率指在有水印的情况下没有检测出水印的概率。

三章、信息隐藏算法
空域信息隐藏的方法
□空域(时域)方法【选择】
–空域的方法是指在图像、视频、音频的空间域上进行信息隐藏。

通过
直接改变宿主媒体的某些像素值(采样值)来嵌入数据。

–优点:无需对原始媒体进行变换,计算简单,效率较高
–缺点:由于隐藏信息要均衡不可感知性和稳健性,因而可选择的属性
范围较小。

此外,难以抵抗常见信号处理的攻击及噪声干扰的影响,鲁
棒性较差。

均值量化空域信息隐藏方法
□设灰度图像的像素灰度值为f
□将图像分块并随机选择L个子块
□每个子块的灰度值f的均值μ
f ≤[μ]-Δ 秘密信息比特0; f ≥ [μ]+Δ 秘密信息比特1
□提取方法: 找到嵌有秘密信息的L个子块,并计算其均值μw,提取的
秘密信息比特为
W = 0 , fw < μw
1 , fw ≥μw
变换域的信息隐藏方法【填空、简答】
□信息隐藏中的常用正交变换
–正交变换:将信号按频谱进行分解,每个分量的值代表信号在此频率
上的能量;反变换则是一个对各频率分量进行加权和的合成过程。

通常,信号的主要能量集中在低频部分,因而变换域低频系数的值普
遍较大,而高频系数则表示信号的突变成份,相对来说值较小。

–信息隐藏中常用的变换有:离散傅立叶变换(DFT),离散余弦变换
(DCT)和离散小波变换(DWT)。

空域和变换域信息隐藏方法比较【简答】
□与空域的方法相比,变换域的方法有如下优点:
–变换域中嵌入的信号能量可以较均匀的分布到空域的所有像素上,有
利于保证不可见性;
–在变换域,HVS(Human Visual System)/HAS(Human Auditory System)
的某些特性可以更方便地结合到嵌入过程中,有利于不可感知性和稳健
性能的提高;
–变换域的方法可与国际数据压缩标准兼容,从而便于实现在压缩域内
的信息隐藏算法。

□变换域方法的主要缺点:
–一般来说,隐藏信息量比空域方法低;
–计算量大于空域算法;
–在正变换/反变换计算过程中,由于数据格式的转换,常会造成信息
的丢失,这将等效于一次轻微的攻击。

离散余弦变换(DCT)
□离散余弦变换的变换核为余弦函数。

DCT除了具有一般的正交变换
性质外,它的变换阵的基向量能很好地描述语音和图像信号的相关特
征。

因此,在对语音、图像信号的变换中,DCT变换被认为是一种准
最佳变换。

□DCT变换的主要特点:
(1)在变换域中描述图像要比在空间域中更简单;
(2)DCT变换后,各个系数间相关性下降,没有空间域那样有很强的
相关性,信号的能量也集中于左上角少数几个低频变换系数上;
(3)有快速算法,能够实现高速的图像压缩和解压缩;
(4)简单、有效,并适合于软件和硬件的应用.
二维离散余弦变换(DCT)在信息隐藏中的应用【策略】
□在一个8×8的图像块中,一共有64个DCT变换系数,其中,最左
上角的那个系数称之为直流(DC)系数,它反映了该像块的平均亮度
值,其余的63个系数称之为交流(AC)系数,经过量化之后,大部分
交流系数值为0。

□将DCT变换之后左上角的交流系数称为低频分量,而将右下角系
数称为高频分量,中间的系数则为中频分量。

□在基于DCT变换的信息隐藏算法中,通常要权衡隐藏算法的鲁棒性
和不可见性,来选择信息嵌入的位置。

当嵌入到DCT系数的低频分量
中时,鲁棒性较强,能抵抗一些常规的攻击,但不可见性差;当嵌入
到DCT系数的高频分量中时,由于高频分量对视觉的不敏感性,其不
可见性较好,载密图像不会产生明显的视觉失真,但鲁棒性不强。

(低
频分量(鲁棒性)↔高频分量(不可见性))
离散小波变换(DWT)
□具有多分辨率分析的特点,在时域和频域都能够表征信号的局部特
征。

小波变换具有“变焦”特性,在低频段可用高频率分辨率和低时
间分辨率(宽分析窗),在高频段,可用低频率分辨率和高时间分辨率
(窄分析窗口)。

□离散小波变换可以用来分析或者叫做分解信号。

DCT域奇偶量化法
⌊f /Δ⌋ mod 2 =0 ↔f在偶区域↔秘密信息比特0
⌊f /Δ⌋ mod 2 =1 ↔f 在奇区域↔秘密信息比特1
f 为要修改的DCT系数. 表示取下整数. Δ>0是量化步长.
四章、数字图像基础
□矢量图是用一系列计算机指令来表示一幅图,这种方法实际上是
用数学方法来描述一幅图。

□点位图是将一副图像在空间上离散化,即将图像分成许许多多的
像素,每个像素用若干个二进制位来指定该像素的颜色或灰度值。

–点位图的优点是:
(1)显示速度快(2)真实世界的图像可以通过扫描仪、数码相
机、摄像机等设备方便的转化为点位图
–点位图的缺点是:
(1)存储和传输时数据量较大
(2)缩放、旋转时算法复杂且易失真
图像的基本属性【选择、填空】
□像素深度
–像素深度指存储每个像素所用的位数。

像素深度决定彩色图像每个
像素可能有的颜色数,或者确定灰度图像每个像素可能有的灰度级数。

–位( bit )计算机存储器的最小单元,用来记录每一像素颜色的值。

□黑白二色的图形,它只有黑、白两种颜色
□ 4位图,它的位深度是4,即16种颜色或16种灰度等级;
□ 8位图,位深度就是8,它含有256种颜色( 或256种灰度等级)。

□ 24位颜色可称之为真彩色,位深度是24。

□调色板
–一个彩色图像假如只包含24位真彩色空间中的16个离散的点,则
可以建立一个颜色查找表(即调色板),表中的每一行记录一组RGB
值,实际像素的值用来指定该点颜色在查找表中的索引值,这样就
可以大大缩小存储量。

□真彩色与伪彩色
–真彩色:真彩色是指在组成一幅彩色图像的每个像素值中,有R,
G,B三个基色分量,每个基色分量直接决定显示设备的基色强
度,这样产生的彩色称为真彩色。

–伪彩色:每个像素的颜色不是由每个基色分量的数值直接决定,
而是把像素值当作彩色查找表(调色板)的表项入口地址,去查找一个
显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生
的彩色称为伪彩色。

BMP文件格式 BMP文件组成的4个部分:
□位图文件头: 包含BMP图像文件的类型、显示内容等信息.
□位图信息头: 包含有BMP图像的宽、高、压缩方法,以及定义颜色
等信息.
□位图颜色表或调色板: 可选,比如真彩色图(24位BMP)就不需要。

□位图像素数据:该部分的内容根据BMP位图使用的位数不同而不同,
在24位图中直接使用RGB,而其他的小于24位的使用调色板中颜色索引
值。

BMP文件格式(顺序扫描)
□ BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上
的顺序。

□ BMP图像格式仅具有最基本的图像数据存储功能,能存储每个
像素1位、2位、4位、8位和24位的位图。

□ BMP格式的特点是包含的图像信息较丰富,几乎不压缩,但由此
导致了占用磁盘空间过大的缺点,因此很少在网页中使用。

一张24位的800×600的bmp格式图形文件大小:
800×600×3Byte=1440000Byte≈1.37MB
JPEG文件格式
□ JPEG文件扩展名jpg、jpeg、jpe、jfif,它用有损压缩方式去除
冗余的图像和彩色数据,获取得极高压缩率的同时图像质量也良好。

JPEG编码标准
□ JPEG有损编码算法的主要计算步骤如下:
1. 将源彩色图像颜色模型变为YUV 模型。

2. 分成8×8数据块进行正向离散余弦变换(FDCT)。

3. 量化(quantization)。

4. Z字形排列量化结果(zigzag scan)。

5. 使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码。

6. 使用游程长度编码(RLE)对交流系数(AC)进行编码。

7. 熵编码(entropy coding)。

□正向离散余弦变换
– DCT是数字图像处理常用的变换,它是一种正交变换,通过DCT变换,把能量集中在少数几个系数上。

–由于大多数图像的高频分量较小,高频系数经常为零,加上人眼对高频成分的失真不太敏感,所以可用更粗的量化。

通过反离散余弦变换回到样值,虽然会有一定的失真,但人眼可接受。

□图像经过二维DCT变换后。

直流分量DC及交流分量AC的低频部分集中了图像的大部分能量。

所以一般把信息隐藏在图像DCT系数的中低频部分。

原因:
–高频部分所分布的能量比较小,对于图像的视觉效果影响不大。

如果将信息隐藏在高频部分,尽管保证了不可见性,但鲁棒性很差。

–由于图像能量的绝大部分都集中于直流和低频部分,人眼视觉系统对于DCT系数的低频变化很敏感,即使很小的变化都会引起可感知的视觉效果改变。

所以在低频部分隐藏信息,尽管鲁棒性较强,但不能保证不可见性,且易引起块效应。

□量化
□因为人眼对亮度信号(Y)比对色差信号(U,V)更敏感,因此使用了两种量化表:亮度量化值和色差量化值。

对Y 采用细量化,而对U 和V 采用粗量化。

□由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。

因而起到了保持低频分量、抑制高频分量的作用。

JPEG2000
□目前的JPEG 静止图像压缩标准,在低比特速率的情况下,重构图像存在严重的方块效应。

JPEG2000 在低比特率的情况下,获得更好的率失真性能和主观图像质量。

□小波变换
– JPEG2000、JPEG最大区别:JPEG 基于DCT,而JPEG2000 基于DWT。

五章、数字音频基础
声卡
□声卡(音频卡)是计算机处理音频信号的专用设备;
□主要功能:播放、录制、编辑与合成音频文件、语音识别等
□声卡基本功能
1) 进行A/D(模/数)转化:将模拟的声音转化为数字化的声音。

经过模数转化的数字化声音以文件的形式保存在计算机中,可以利用声音处理软件对其进行加工和处理;
2) 进行D/A (数/模)转化:把数字化的声音转换成为模拟的自然的声音。

转换后的声音通过声卡的输出端送到声音还原设备。

如耳机、音箱、音响放大器等;
3) 实时、动态地处理数字化声音信号。

4) 输入、输出
声音信号
□声音是通过空气传播的一种连续的波,叫声波。

□声音的强弱体现在声波压力的大小上,
声调的高低体现在声音的频率上。

□声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号。

□声音信号由不同频率的信号组成,称为复合信号,而单一频率的信号称为分量信号,
□声音信号的一个重要参数就是带宽,用于描述组成复合信号的频率范围,如高保真声音的频率范围为10Hz~20kHz,带宽约为20kHz。

声音信号类型
–频率范围为20 Hz~20kHz的信号称为音频(Audio)信号;
- 人说话的信号频率通常为300~3kHz,称为语音(Speech)
声音信号数字化
□采样和量化过程所用的主要硬件是A/D转换器和D/A转换器。

★采样过程:将连续时间轴离散化,即每隔一个时间间隔在模拟声音波形上取一个幅度值(采样的时间间隔称为采样周期),得到离散时间信号。

□采样率:通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。

如44kHz采样率就是要44000个数据来描述1秒钟的声音波形。

□采样率选择与音频信号的类型以及应用环境有关。

★量化过程:将连续幅度的采样值离散化,得到数字信号。

□采样值量化位数:其大小反映出对各个采样点进行数字化时所选用的精度,一般有8位和16位两档。

量化位数越大,对音频信号的采样精度就越高,但信息的存储量也相应提高。

声音信号数字化
□采样频率
–奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,即无损数字化。

–采样定律用公式表示为:fs≥2f或Ts≤T/2
其中f为被采样信号的最高频率。

例如,电话话音的信号频率约为3.4kHz,采样频率就选8kHz.
□常用的音频采样率【选填】
8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。

声音信号数字化
□样本大小(也称为采样精度)是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。

例如,每个声音样本用16 位(2字节)表示,测得的声音样本值是在0~65535的范围里。

□声音通道的个数称为声道数,是指一次采样所记录产生的声音波形个数。

如果是单声道,则只产生一个声音波形。

音频文件分类
□ WAV文件
–它使用三个参数来表示声音:采样频率、量化位数和声道数。

–WAV文件所占容量(字节数/秒)=采样频率×量化位数×声道数/8
□ WAV文件组成
□文件头:标明是WAVE文件、文件结构和数据的总字节数
□数字化参数:如采样频率、声道数、编码算法等
□实际的波形数据
□ WAV文件优点:易于生成和编辑。

缺点:在保证一定音质的前提下压缩比不够,不适合在网络上播放。

□ MP3文件
□第一个实用的有损音频压缩编码□高压缩比4:1; 12:1
□保持良好的音质:利用了知觉音频编码技术,也就是利用人耳的特性,
削减音乐中人耳听不到的成分。

□ MP4文件
□ AU文件
□ MID文件电子乐器的声音。

数据量小,适合在网络上传输。

□ RA/RM文件主要用于在低速率的广域网上实时传输音频信息
□ WMA文件相对于MP3的主要优点是在较低的采样频率下音质要好些
语音编码标准
□ G.711 (所需带宽:64Kbps)
□ G.721 (所需带宽: 32Kbps) 8kHz采样,先用A律或μ律压扩-PCM-
ADPCM,其中自适应部分是自适应非均匀量化。

优点:压缩比大; 缺点:声音质量一般.
□ G.722(所需带宽: 64Kbps)针对30Hz-7kHz广播质量音频的压缩编
码标准,是第一个用于16 kHz 采样率的标准化宽带语音编码算法。

16位
量化,使用了SB-ADPCM编码方法。

优点:音质好; 缺点:带宽要求高.
□ G.723(双码率语音编码算法, 带宽:5.3/6.3Kbps)
优点:码率低,带宽要求小,性能稳定缺点:音质一般
□ G.723.1编码(低码率语音编码算法, 带宽:5.3Kbps)
□ G.728(所需带宽:16Kbps/8Kbps )
优点:后向自适应,采用自适应后置滤波器来提高其性能;缺点:复杂
□ G.729编码(所需带宽:8Kbps)
–优点:语音质量良,应用领域很广泛,采用了矢量量化、合成分析
和感觉加权,提供了对帧丢失和分组丢失的隐藏处理机制;
- 缺点:在处理随机比特错误方面性能不好。

□ WMA (带宽:320~112Kbps,压缩10~12倍)
□特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式
中表现得最出色,但当Bitrate再往上提升时,不会有太多的音质改变。

□优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频,文
件很小。

- 缺点:当Bitrate大于128K时,WMA音质损失过大。

音频压缩技术
□时域压缩(或称为波形编码)
–是指直接针对音频PCM码流的样值进行处理,通过静音检测、非线性
量化、差分等手段对码流进行压缩。

–时域压缩技术的共同特点是算法复杂度低,声音质量一般,压缩比小,
编解码延时最短(相对其它技术)。

–时域压缩技术一般多用于语音压缩,低码率应用(源信号带宽小)的
场合。

□变换域压缩技术
–与子带压缩技术的不同之处在于该技术对一段音频数据进行“线
性”变换,对所获得的变换域参数进行量化、传输,而不是把信号分解
为几个子频段。

–通常使用的变换有DFT、DCT(离散余弦变换)、MDCT等。

–根据信号的短时功率谱对变换域参数进行合理的动态比特分配可
- 使音频质量获得显著改善,付出的代价则是计算复杂度的提高。

□子带压缩编码技术
□子带压缩编码的好处
①可以对每个子带分别进行自适应控制,独立设计预测编码器,量化阶
的大小可按每个子带的能量电平(振幅)加以调节
②根据每个子带信号感觉上的重要性,对每个子带分配不同的比特数。

③把噪声限制在各自的子带内,防止了子带间噪声的相互干扰。

④充分利用人的听觉特性。

如利用掩蔽效应,去掉部分被掩蔽的子带。

六章、图像数字水印技术【理解】
图像数字水印系统基本要求
□不可见性。

即是指水印的嵌入不会明显降低被保护的图像数据的质
量,通过人眼不能感知水印的存在。

□鲁棒性与脆弱性。

鲁棒性是鲁棒图像水印的重要特征,即是指含水印
图像对添加噪声、图像平滑、图像增强、滤波、有损压缩、平移、旋转、
缩放、剪切等常见图像处理具有鲁棒性。

脆弱性是脆弱图像水印的重要
特征,嵌入的脆弱水印能够检测出任何对图像像素值改变的攻击,或局
部的内容篡改等。

□安全性。

不仅包括通过一些恶意的攻击来破坏、删除水印,如密钥分
析攻击、伪造攻击、拼贴攻击、Oracle攻击等,还包括未经授权的嵌入
和提取等。

绝对安全的水印系统是指水印的嵌入是完善保密的。

□嵌入容量。

即是指能嵌入的水印应包含尽可能多的容量,以满足各种
不同场合下的应用需求。

□盲提取。

指水印的提取不需要原始图像数据或边信息的参与。

★常见攻击
□鲁棒性攻击
□类噪声攻击:图像平滑、图像增强、锐化、滤波、有损图像压缩、
噪声污染、直方图均衡等。

□常见的几何攻击:旋转,缩放,平移即RST变换, 另外还有图像剪
切,局部扭曲,线性变换等等
□ IBM攻击
也称为诱惑攻击,这是针对可逆、非盲水印算法而进行的攻击。

其原理
为设原始图像为I,加入水印的图像为IA=I+WA 。

攻击者首先生成自己的
水印WF,然后创建一个伪造的原图IF=IA-WF ,也即IA=IF+WF 。

这就产
生无法分辨与解释的情况。

防止这一攻击的有效办法就是研究不可逆水
印嵌入算法,如哈希过程。

□ StirMark攻击
□采用软件方法,实现对水印载体图像进行的各种攻击.
□StirMarkBenchmark4.0:从多方面测试水印算法的鲁棒性,测试的攻
击手段包括线性滤波,非线性滤波,剪切/拼接攻击,同步破坏攻击等。

同时还为用户保留了自定义测试方法的接口。

□StirMark可对水印载体进行重采样攻击,它可以模拟首先把图像用高
质量打印机输出,然后再利用高质量扫描仪扫描重新得到其图像这一过
程中引入的误差。

□马赛克攻击
□串谋攻击
□二次或多次水印攻击
□法学攻击
图像置乱
□一般在水印嵌入前都要进行置乱,置乱算法与加密不同,它是将水印
的像素位置重新随机排列。

□置乱的目的:(1)提高安全性,一般可通过置乱算法设置密钥,攻
击者即使提取出了置乱后的水印,但无密钥无法恢复水印;(2)提高稳
健性,尤其是对剪切攻击.
数字水印的性能评估
□对图像数字水印的评估主要包括两个方面:水印稳健性的评估;
嵌入水印对图像引起的失真的主观和客观定量评估。

□其它评估:水印容量、安全性、实时性等。

□一般而言,在水印的稳健性与不可感知性之间需要进行折衷。

□影响水印稳健性的因素
□嵌入的信息量。

对同一个水印方法而言,要嵌入的信息越多,
则水印的稳健性越差。

被嵌入的信息依赖于各种不同的应用场合。

□水印嵌入强度。

水印嵌入强度和水印可见性之间存在着一个折
衷。

增加稳健性就要增加水印嵌入强度,相应地也会增加水印的可见
性。

□图像的尺寸和特性。

□密钥
七章、数字音频水印技术
□数字音频水印技术背景和意义
□音频水印是一门新兴的多学科交汇的技术,其应用主要有四个:
版权保护、内容检索、数据监视与跟踪、可靠性认证。

□意义:数字音频水印技术将水印信息嵌入到原始音频中而不显著地
影响其质量。

根据不同的应用,嵌入的水印数据可以是版权信息、序
列号、文本、认证码、一个小的图像甚至是一小段音频。

水印隐藏在
宿主音频数据中通常不为人所感知,此外还必须能够抵抗常规音频信
号处理以及某些恶意的攻击。

数字音频水印系统基本要求
□水印必须嵌入到宿主音频数据中,否则很容易被修改或除去。

□水印必须具有感知透明性,即不能对原始音频的质量产生明显
影响。

□为保证水印的安全性,一般在嵌入过程和检测过程中要使用密钥。

□水印应该对MP3 有损压缩、低通滤波、噪声、重采样等音频信号
处理具有鲁棒性。

□嵌入和检测的计算代价要足够小以进行实时处理。

□多数情形下,水印检测为盲检测,因为寻找原始音频十分困难。

□水印算法最好是公开的,即安全性应依赖于密钥的选择而不是对
算法进行保密。

满足以上全部要求很困难。

有些性质如鲁棒性、透明性和数据
容量之间相互矛盾,因此,寻找最佳平衡是水印系统设计的目标。

数字音频水印特点
□要考虑到音频载体信号在人类听觉系统、音频格式以及传送环境等
方面的特点。

与图像、视频相比,音频信号在相同的时间间隔内采样
的点数少。

这使可嵌入的信息量较少。

□由于人耳听觉系统(HAS)要比人眼视觉系统(HVS)敏感得多,因此听
觉上的不可知觉性实现起来要比视觉上困难得多。

音频水印算法感知质量评价标准
□主观感知质量评测标准
MOS 主观评分标准、SDG主观评分标准、ODG 客观评分标准
音频水印分类
□按应用目的,分为鲁棒性水印和脆弱性水印。

□按作用域,分为时域算法、变换域(频域)算法和压缩域算法三类。

□音频信息隐藏技术之间的区别主要体现在数据嵌入/提取方案的
不同,早期的方法主要有以下四种:最不重要位方法、扩展频谱方法、
相位编码方法、回声隐藏方法。

时域音频水印技术
LSB方法:可以在音频中传送大量的数据,但由于很微小的操作也
能改变最低比特位,所以水印的鲁棒性很差,较适用于脆弱水印设计。

回声隐藏算法:利用人类听觉系统的音频信号在时域的向后掩蔽
效应,即弱信号在强信号消失之后50-200ms的作用不被人耳察觉。

频域音频水印技术
□频域算法采用数学变换的方法,将一个域内的数字信号映射为另一
域内的数字信号,然后加入水印,再逆变换为原来域中的数字信号。

□相对于时域嵌入,变换域嵌入技术研究较多。

主要因为在变换域嵌
入水印可以把水印能量扩散到多个样本信息上,改善了水印的鲁棒性
和不可察觉性,此外,变换域的方法可与国际数据压缩标准兼容。

□早期音频水印技术将水印信号放在高频区域的听觉不重要区域,但
音频信号的压缩编码常把高频部分压缩掉,因此难于抵抗MP3压缩攻
击,而将水印放在低频带,可以达到提高鲁棒性的目的,但不可听性
下降。

为此,折衷考虑,可选择在中频带嵌入水印。

□常用的主要变换有离散余弦变换(DCT)、离散傅立叶变换(DFT)、
离散小波变换(DWT)等。

□ DCT域方法:DCT变换是静态数字图像压缩标准JPEG和视频压缩标
准MPEG的核心算法。

DCT域水印算法计算量较小。

□DFT域方法:首先对音频信号进行DFT变换,然后选择中频带嵌入
水印,但由于DFT系数为复数形式,修改其幅度或相位嵌入水印必须
考虑反变换后时域数据不为实数的情况。

□DFT域水印嵌入采用的方法主要有:量化调制法、Patchwork 方法、
相位编码方法等,其中量化调制法可灵活调节量化步长来控制水印的
不可听性和鲁棒性,量化步长通常基于心理声学模型来选择。

□ DWT域方法:DWT变换在低频段用高频率分辨率和低时间分辨率,
在高频段用低频率分辨率和高时间分辨率,这种非线性时频特性更适
合音频信号的特点和听觉系统的时间频率分辨特性。

表4 DCT、DFT、DWT应用于音频水印技术的性能比较。

相关文档
最新文档