多媒体数据压缩编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
JPEG
压
缩
编
码
算
法
2.DPCM 框图 3.特点:质量高,基本无失真,但是压缩率不 大(2:1) Fig446
二.改进型JPEG 压缩算法
1.累进操作 原理: 压缩
恢复图象 删除部分系数
质量好? 是
删除部分系数:高频系数: 象元数字的低位部分
2. 分层操作:
图象金字塔:分辨率从上到下层次增
x y
f (x,y) = E(u)E(v)C(u,v) Cos(u (2x+1)/2M ) Cos(v(2y+1)/2N)
x=0,1,2,....M-1 y=0,1,2,.....N-1 E(u) = E(v) = 1/2 1 当 u=0,v=0
四。 熵编码 -- Huffman 编码
高频部分采用粗区间,根据人的视觉对高频细节不敏感,进一步 压缩他们的系数大小
差分编码:相邻子块的DC分量相差不大,对他们采用 差 分 编 码 行程编码:其余63个系数按Z字型行程进行编码, 提 高 行 程 相 同 率
结 AC
果 分 符号1 量
: :
符 DC 符 分
号 量 号
2 : 1
符
号
2
5
对
计算机系统中存贮、传送、处理均是以bit为单位,空间和时 间开销巨大,使得现有计算机上难于实现多媒体处理,压缩 数据是必要的。
二.压缩原则
目的 在保持信息不变的情况下,减少总的bit量; ---减少总的数据量 ---缩短每个数据长度; 什么是信息不变?
方式
寻找一种可逆的数字编码方法
2. 预测法
设:原有数据
x0, x1, x2, ... xi,
...
xn,
x1 = x1 - x0 当x0, x1 高度相关时 x1 很小 如果:从x0 估计出x1’ 使得x1’ x1 x1’ = x1 - x1’ 更小 , 可以用( x0, x1’, x2’, ... ) 来表示原来的数据,缩短每一个 数值。
编码
。压缩标准:JPEG 3.动态(运动)图象 ―― 连续拍摄的图象序列 。压缩原理:利用连续图象帧之间的高度相关性 -帧间编码 。压缩标准:MPEG
2. JPEG 压缩编码的基本算法 ( 基于DCT 变换的基本算法 )
一.算法描述
1.子块分割
子块: 8 × 8 象元, 特点: 象元间变化平缓,相关性高
2
.
子
块
DCT
变
换
― ― → F(u,v): 8 × 8 二 维 数 组 6 4 个 系 数 . DC 分 量 F(0,0) 图 象 平 均 灰 度 值 , . AC 分 量 6 3 个 系 数 , 高频部分,图象细节 特点:系数集中在F(0,0) 左右
3
.
量
化 F‘(u,v)
: =
对 Int(
多媒体数据压缩编码
4。1。压缩编码 一.为什么要压缩数字化声音 普通话音: 采样率8KHZ,精度8bit,每分钟产生3.84Mbit; 高保真声音:采样率41KHZ,精度16bit,每分钟产生 42Mbit 数字化视频图像 640X480X24bitX30帧 每秒钟221Mbit
三。 编码器
1。若 {vi }有M个可能值,则设置M 个二进制码与之对应, 例如:
M= 8: { v1,v2,v3,v4,v5,v6,v7,v8, }
c = { 000, 001, 010, 011, 100, 101, 110, 111} v7 --- 110
注意:c 的顺序可以随便,主要是一一对应
每
一 F(u,v)
个
系 /⊿(u,v)
源自文库
数
作 )
。Int() - 取 整 数 。⊿(u,v) -系数(u,v)的量化宽度随(u,v)的变化而变化; 典 16 1 1 1 24 49 72 型 12 的 10 例 16 24 子 40 为 51 :
2 4
61 1 2 1 3 8 113 92 121 120 101 100 103 99
1。原理:频率高者编短码,反之用长码
2。Huffman 树
。排列。归并最小概率。分配 D: d1 d2 0.04 0.06 0 0.1 0 1 1 0.2 0 0.3 0 1 1 1 d3 d4 d5 0.1 0.1 0.3 d6 0.4
3。 特点:
.最小概率最长码,最大概率最短码 .码串分割是唯一的 01 001 01 01 001 00001 01
压缩编码 格式 A 格式 B 解压缩编码 所有的编码方式必须是可逆的
格式B 有较少的数据或较小的数值。
三. 多媒体数据压缩的可能性
声音图像中大量的空白或相同无变化的数据,称为冗余数据 信息 声音图像数据中相邻的数据往往变化不大,称为有较高的相 关性 人们对音像媒体的理解往往利用其与目的有关的主要特征, 去除与目的无关的信息不影响视听效果
64 k
SB-ADPCM
电视电话 卫星通信
效率高
CD-I DVI
128 k
ADPCM SB-ADPCM
LD\CD 音响
质量高
MPEG
三。G722 标准
1。原理:
一个好的声音必须有高低音,但是人们对高音段往往不太敏感
高段采用低分辨率,低频段保证足够的分辨率
2。 总框图
正交 镜向 滤波 器 高端 SB-ADPCM 多 路 调 制 器 MUX
例如:二维图象:
(G0, L0) (G1,L1)(G2,L3).......... 2. 特点: 当串长数据大于二个数码值时,压缩有效 3。 应用: 二值化图象, 平涂图片,黑白文字。。
二。差分脉冲编码调制 ------- DPCM
x
x
1.原理:
x 1 = x1 - x0 d 1 = x1 - x1’
2. 常用码: 等长码: 自然码: 000, 001, 010, 011, ... 格雷码:111,110,100,101,001,... 反射码:000,001,010,011,100 ,011,110,111 变长码:0, 10, 11,110,...
4。2。2。 常用编码方法
一。 行程码
1。 原理:数据序列中相同数据串表示为二个数码: ( 数据值, 串长 )
音频 数字化
低端 SB-ADPCM
4 静态彩色图象的压缩编码
1图象的压缩编码
1.图象压缩的指标: 。数据压缩率 比率(倍) = (压缩编码前总比特)/(压缩 编码后总比特) 。图象恢复质量:主观评价: 极好、好 、中、差、 劣
2.静态图象 ―― 单幅图象,彩色:RGB, YUV 。压缩原理:利用图象象元之间的相关性-帧内
2。编码类型:
。 波形编码: PCM, DPCM, ADPCM . 参数编码:LPC线性预测码 。 混合编码(波形 + 参数) 码激励线性预测(CELPC), 多脉冲线性预测(MPLPC)
二。常用编码标准
标准
G711 G721
速率bps
64 k 32 k
方法
PCM ADPCM
应用
电话网
质量
一般
G722
4
5
50
yi ---. vi 1. 量化误差:
E qms =
( yi - vi * ) * ( yi - vi * )
越大 , E qms 越大, 但是量化值越小 2。 变区间量化: 大小根据yi出现 的概率而定,概率大 0 1 | | 2 | 3 | 4 5 | |
的yi 对应大的
.
熵
(
Huffman)
编
码
符 号 1 , 用 Huffman 编 码 符号2,用变长码,长度由符号1指定。
二. JPEG编码的效率
压缩率:
16
- 32 8 - 16 6-8 4- 6
质量: 中-好 好-很好 极好 原图难分
2. 其
他
。基于二维DPCM的JPEG压缩算法
1. 方案 Fig 445 根据图象象元的上下左右相关性, 预测估计象元的值,然后作差分。 X'm n = a Xm n-1 + b X m-1 n + c Xm-1 n-1
一.预测图象:
压
缩
原
理
:
运动量补偿 前帧图象 当前图象 二.双向预测:
前帧图象
当前图象
后帧图象
5.2 MPEG图象的压缩算法
一.MPEG图象序列
I: 帧内图 基准图象。用帧内压缩(类似于JPEG方法) P: 预测图 P : I + mv mv为运动补偿 B: 内插图 双向预测图 B : (P + I )/ 2
4。效率:
平均码长 R = Li*pi 最大平均码长: H = - pi*Log2 pi R H 好
0.6
0
00000 00001 0001 001 01 1
4。3。 音频数据的压缩编码
一。 语音的压缩编码效率与方法
1。效率 压缩率:倍数,压缩前后比特(Bit) 之比 质量:声音恢复后的质量,质量评价标准: 声音:MOS记分法:优、良、中、差、劣 语言:可懂度、清晰度、自然度
加 a. 上一层压缩编码: Jpeg b. 恢复图象 c. 插值,分辨率增加一层,作为下一 层预测图象 d. 差分编码 Dpcm 编码 = Jpeg + Dpcm
5 动 态 图 象 的 压 缩 编 码 及 MPEG 标 准 5.1动态图象的一般特征及压缩原理
一.动态图象:
· 空间+时间
四. 压缩编码分类
无损压缩 -- 解码后可100 % 恢复原来数据 有损压缩 -- 解码后与原来数据有所不同。
五。主要压缩编码方法:
1.变换法:正交变换
例 声音 x ( t ) 的富里叶变换 x(t) F( f ) t 为时间 , f 为频率 , F( f ) 为频谱系数,数量较少
用 F( f ) 来存贮声音,需要时逆变换恢复原声音 适当压缩高频式低频系数,通过逆变换不影响声音的效果 常用变换:FT,CT,Hadamard,K一L等 选择原则:变换后系数集中(较少),计算方便
4。2。1。 编码器原理
映 射
{xi} {yi}
量 化 {vi}
g l M { (gi, li) } i=1,2, ...
编 码 {ci}
一。映射 ----减少减短数据。 1。变换法: 2。差分: 3。行程: M * N
N
二。 量化: v 0 1 -- 量化区间
10
1
2 3 y 20
30 40
常用方法:DM, DPCM, ADPCM, LPC
3. 统计(熵)编码
根据数码出现的频数(概率)来分配码长度,概率大则分配短 码长,反之则长码,总体上减少 Bit 数。
Huffman码,算术编码。
4。 混合编码 多种方法联合使用,提高编码效率。 JPEG, MPEG, H261 ....
2. 压缩编码的一般原理
X1’
x 数值小,可以压缩效果 di = xi - xi’
x0
x1
x2
x1’ 估计正确,d1 数值很小系数, 如何估计 x1’ ?
xi’ = p*x i -1 + (1 - p)* m
m = xi 平均值
p = E{xi,xi-1}/E{xi*xi} 称为相关系数, p = 0 不相关 xi’ = m 为平均值
f (x,y,t)
· 表达方式: 图象帧序列 Fig45-1。时间常数Δ t。 40ms。 · 数据量 bits: M × N × B × 3× 1/
二.
物体的运动特征 -- 相邻帧的相关性
1.运动量的一致性:相邻帧图象中物体作近似平移移动 。
2.运动变化的连续性:连续帧中物体变化轨迹平缓。
三
.
p = 1 全相关
x i -1 = xi 全相同。
2。DPCM 编码器:
Xi
di
-
量化
i
di’
Xi’
适应器
Xi’
+ di’
预测器
+
Xi’
3。ADPCM-- 自适应的DPCM
当输入变化很大时(di 很大)采用较大的 值
可以提高量化速度和精度,及压缩效率
三。正交变换 -- DCT 离散余弦变换 1。DCT 变换的特点: - 系数比较集中 - 计算比较简单 2。 公式: C(u,v) = 4/MN E(u)E(v) f(x,y) Cos(u (2x+1)/2M ) Cos(v(2y+1)/2N)
多媒体数据压缩编码
1.压缩与编码 2.压缩编码的一般过程 2.1.编码器原理 2.2.常用的编码算法 3.语音压缩编码 静态彩色图象的压缩编码 1. 图象的压缩编码 2.JPEG 压缩编码的基本算法 3.其他JPEG压缩编码算法 5. 动态图象的压缩编码及MPEG标准 5. 1. 动态图象的一般特征及压缩原理 5. 2. MPEG图象的压缩算法
二. 运动补偿算法:
已知图象 I0 I1 I3 , I1需要预测 运动补偿单元: 宏块 单元 宏块预测公式:若已知运动量为 mv(x, y),Fig45-4
则当前块预测 B’1(x,y) = B0(x+x, y+ y) 或双向预测 : B’1(x,y) =( B0(x1+x1, y1+ y1) + B2(x2+x2, y2+ y2) )/ 2