第三讲 数字媒体数据压缩技术new

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2012-6-25
25
按照媒体的类型进行分类
图像压缩标准
声音压缩标准 运动图象压缩标准
2012-6-25
26
通用的数据压缩技术
通用的数据压缩技术:
PCM DM DPCM 行程编码 字典编码 变换编码 熵编码等
通用的压缩方法具有压缩比低、通用性强等特点
压缩解压速度 压缩解压速度要快 动态视频要求更高
2012-6-25
22
数据压缩分类
数据压缩分类 数据压缩方法分类 数字媒体压缩标准分类
统 计 编 码
预 测 编 码
变 换 编 码
分 析 合 成 编 码

图像压缩
视音频压缩
JPEG 等 运动图像 声音
MPEG
H.26x 系列
AVS
M P 3
2012-6-25
35
PCM系统原理图
数字化(A/D) 模拟信号 滤波 采样 量 化 编 码
传输
模拟信号
D/A 转换
逆量 化 模拟化(D/A)
解 码
2012-6-25
36
PCM编码
2012-6-25
37
PCM编码的优点
有很强的抗干扰性
能方便的利用计算机编程,实现各种智能化设计。
2012-6-25
23
2012-6-25
数据压缩分类
按信息压缩前后比较是否有损失,可以划分有损压缩
和无损压缩 。
无损压缩指使用压缩后的数据进行重构,重构后的数据
与原来的数据完全相同。常用的无损压缩算法有霍夫曼 (Huffman)算法和LZW算法 。
有损压缩是指使用压缩后的数据进行重构,重构后的数
据与原来的数据有所不同,但不影响人对原始资料表达 的信息造成误解。
亮度和色差信号
2012-6-25
17
听觉冗余
人耳对不同声音的敏感性不同,并不能察觉所有频率
的变化,对某些频率不关注。 声音振幅 声音频率
2012-6-25
18
数据压缩技术的性能指标
性能指标 压缩比 数据压缩质量 压缩、解压的速度 压缩算法所需要的软件、硬件环境
2012-6-25
40
差分脉冲编码调制DPCM
差分脉冲编码调制(Differential Pulse Code
Modulation,DPCM)是利用样本与样本之间存在的 信息冗余度来进行编码的一种数据压缩技术。
差值脉冲编码调制是利用信号的相关性找出可以反映
2012-6-25
39
DM波形编码的原理
在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,这种现象 就称为增量调制器的“斜率过载” 。 在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零的区域,增 量调制器的输出出现随机交变的“0”和“1”。这种现象称为增量调制器的粒状 噪声
2012-6-25
16
视觉冗余
人类视觉系统对于图象场的任何变化,并不是都能感
知的。 图像噪声
对于图象的编码处理时,由于压缩或量化截断引入了噪声而
使图象发生了一些变化,如果这些变化不能为视觉所感知,仍 认为图象足够好。
视觉分辨率约为26灰度等级
一般图象量化采用28灰度等级
视频的YUV信号冗余
计平均,即 H(X)=E{I(xj)}=
P ( xj ) log 2 P ( xj )
j 1
n
H(X)称为信源X的“熵”,即信源X发出任意一个随机 变量的平均信息量。 其中,等概率事件的熵最大,假设有N个事件,此时 熵为: N 1 1 H(X)= log 2 = log 2 N
38
增量调制(DM)
增量调制也称△调制(delta modulation,DM),它是
一种预测编码技术,是PCM编码的一种变形。 DM是对实际的采样信号与预测的采样信号之差的极 性进行编码,将极性变成“0”和“1”这两种可能的取值 之一。如果实际的采样信号与预测的采样信号之差的 极性为“正”,则用“1”表示;相反则用“0”表示,或 者相反。
事件出现的可能性愈小,其信息量愈多,反之亦然。 若pi为第i个事件的概率为0≤ pi ≤1,则该事件的信息量 为
一个信源包括的所有数据叫数据量,而数据量中包含
有冗余信息。 信息量 = 数据量-冗余量
2012-6-25
29
信息熵
信息熵就是将信源所有可能事件的信息量的平均。
设从N个数中选定任一个数xj的概率为p(xj),假定选定
这是图象数据中经常存在的一种冗余。
在同一幅图象中,规则物体和规则背景的表面 物理特性具有相关性,这些相关性的光成象结
构在数字化图象中就表现为数据冗余。
2012-6-25
12
时间冗余
这是序列图象和语音数据中所经常包含的冗余。 图象序列中的两幅相邻的图象之间有较大的相关性,这反映为时间冗
编码器输出码字的平均码长,其计算公式为: Lc=
P( x ) L( x )(j=1,2,…,n)
j j j 1
n
其中:P(xj) 是信源X发出xj的概率,L(xj)为xj的编码长。
2012-6-25
33
信息熵(续)
平均码长与信息熵之间的关系为: Lc≥H(X) 有冗余,不是最佳。 Lc < H(X)不可能。 Lc = H(X)最佳编码( Lc稍大于H(X) ) 熵值为平均码长Lc的下限。
淮永建 北京林业大学信息学院 huaiyj@163.com ftp://202.204.125.41/huaiyongjian
回顾
光存储技术发展现状
光道上数据存储方法 VCD/DVD区别?
CD-DA数据容量计算方法?
2012-6-25
2
主要内容
信息表示和数字化 数据压缩及分类
2012-6-25
34
脉冲编码调制PCM
脉冲编码调制 (Pulse Code Modulation, PCM)就是将
模拟调制信号的采样值变换为脉冲码组。 PCM编码包括如下三个过程:
采样,将模拟信号转换为时间离散的样本脉冲序列。
量化,将离散时间连续幅度的抽样信号转换成为离散时
间离散幅度的数字信号。 编码,用一定位数的脉冲码组表示量化采样值。
2012-6-25
19
数据压缩技术的性能指标
压缩比 输入数据量和输出数据量之比 Bpp
质量 无损压缩 有损压缩
2012-6-25
20
数据压缩技术的性能指标
压缩算法评价
主观
客观

En 1 / n ( x [ i ] x [ i ]' )
SNR ( dB ) 10 lg
x
2
均方误差 信噪比 峰ຫໍສະໝຸດ Baidu信噪比 x[n]原始信号 x[n]’重建 信号 xmax为峰值信号

2 x

max 2 r
2 x 2 r
2
PSNR ( dB ) 10 lg

E [ x ( n )],
2
2 r
E {[ x [ n ] x [ n ]] }
2

2012-6-25
21
数据压缩技术的性能指标
2012-6-25
6
模拟信号数字化方法
采样率——采样频率 量化等级——量化位数
量化位数=log2K K为量化等级
2012-6-25
7
采样定理
采样定理? 仅当采样频率≥2倍的原始信号频率时,才能保证 采样后信号可被保真地恢复为原始信号。 设电视信号YIQ彩色空间各分量的带宽分别为: 4.2MHZ、1.5MHz、0.5MHz,量化等级8比特 (4.2+1.5+0.5)*2*8Mb=99.2Mb 量 化 位 数 8bit,1 秒 钟 电 视 信 号 的 数 据 量 约 为 100Mbps。650MB的CD-ROM仅能存约1分钟的原 始电视数据。若HDTV(1.2Gbps), 一张CD-ROM还 存不下6秒钟的HDTV图象。
2012-6-25
24
数据压缩编码原理
按数据压缩编码的原理和方法可划分为
统计编码,主要针对无记忆信源,根据信息码字出现概
率的分布特征而进行压缩编码,寻找概率与码字长度间 的最优匹配。 预测编码是利用空间中相邻数据的相关性来进行压缩数 据的。 变换编码是将图像时域信号转换为频域信号进行处理。 分析—合成编码是指通过对源数据的分析,将其分解成 一系列更适合于表示的“基元”或从中提取若干更为本 质意义的参数,编码仅对这些基本单元或特征参数进行。
压缩的可能性与信息冗余 数据压缩分类
通用的数据压缩技术

编码的理论基础 脉冲编码调制 PCM 增量调制(DM) 差分脉冲编码调制 DPCM 词典编码 行程编码 变换编码 信息熵编码——霍夫曼编码、算法编码
2012-6-25
3
信息表示与编码
数字化表示
2012-6-25
2012-6-25 8
语音信号数字化举例
人说话的音频一般在20Hz到4KHz, 即人类语音的带宽
为4KHz。语音信号的数字化表示? 依据采样定理, 量化位数8bit, 则1秒钟信号量为64Kbits (4×2×8)=8KB。 因此, 人讲1分钟话的数据量为480KB。 Mp3音频 CD音频 数字化处理的关键问题-数据压缩
其中b(yi)是分配给码元yi的比特数, 理论上应取 b(yi)=-log2Pi. 实际一般取b(y0)=b(y1)=…=b(yK-1). Huffman coding ? 例如, 英文字母编码码元长为7bit, 即b(y0)=b(y1)= … =b(yK-1)=7, 这样d>H, 由此带来的冗余称为信息熵 冗余或编码冗余。
任意一个数的概率都相等,即p(xj) =1/N,则
I(xj)=log2N=-log2 1/N =-log2p(xj)=I[p(xj)]
上式中,p(xj)是信源X发出xj的概率。I(xj)的含义是信源 X发出xj这个消息(随机事件)后,接收端收到信息量 的量度。
2012-6-25
30
信息熵(续)
信源X发出的xj(j=1,2,…,n)共n个随机事件的信息量的统
j 1
N
N
2012-6-25
31
信息熵(续)
当P(x1)=1时,P(x2)=P(x3)=…=P(xj)=0,此时熵为
H(X)=- P(x1) log 2 P( x1) =0
由上可得熵的范围为:
0≤ H(X) ≤
log 2 N
2012-6-25
32
信息熵(续)
在编码中用熵值来衡量是否为最佳编码。若以Lc表示
2012-6-25 27
编码理论
数据压缩技术的理论基础是信息论。
根据信息论的原理,可以找到最佳数据压缩编码方法,
数据压缩的理论极限是信息熵。
熵是信息量的度量方法,它表示某一事件出现的消息
越多,事件发生的可能性就越小,数学上就是概率越 小。
2012-6-25
28
信息与信息量
信息量是指信源中某种事件的信息度量或含量。一个
2012-6-25
9
音频属性
2012-6-25
10
数据压缩的可能性与信息冗余
数据能够被压缩的主要原因在于媒体数据中存在数据
的信息冗余。信息量包含在数据之中,一般的数据冗 余主要体现在:
空间冗余
结构冗余
时间冗余 视觉冗余
知识冗余
信息熵冗余
2012-6-25
11
空间冗余
4
数字化表示


传统上用模拟方式表示声音和图象信息
模拟信号表示信息的主要缺陷?
易出故障,常产生噪音和信号丢失,且拷贝过程中噪 音和误差逐步积累; 模拟信号不适合数字计算机加工处理。

数字化处理:巨大的数据量
2012-6-25
5
数字化表示
基本概念 采样频率 量化精度 数据流 二进制数据表示
2012-6-25 14
结构冗余
有些图象从大域上看存着非常强的纹理结构,我们称
它们在结构上存在有冗余. 例如布纹图象和草席图象
2012-6-25
15
知识冗余
有许多图象的理解与某些基础知识有相当大的相关性。 例如,人脸的图象有固定的结构。比如说嘴的上方有鼻
子, 鼻子的上方有眼睛, 鼻子位于正脸图象的中线上等 等。 这类规律性的结构可由先验知识和背景知识得到, 我 们称此类冗余为知识冗余。
余。 在语言中,由于人在说话时发音的音频是一连续的渐变过程,而不是一 个完全时间上独立的过程,因而存在时间冗余。
运动矢量
2012-6-25 13
信息熵冗余
信息熵是指一组数据所携带的信息量,它定义为: H=-∑i=0N-1Pilog2Pi N为数据类数或码元个数, Pi为码元yi发生的概率. 为使信息编码单位数据量d接近于或等于H,应设: d=∑i=0N-1Pib(yi)
相关文档
最新文档