《通信原理教程》(第3版) 樊昌信 编著 第十二章 PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实际应用中,多采用离散余弦变换。 国际标准:JPEG
图12.3.1 像素发送次序
14
12.3.2 动态图像压缩编码 原理:动态数字图像是由许多帧静止图像构成的,可以看 成是三维的图像;在邻近帧的像素之间也有相关性。所以, 动态图像的压缩可以看作是在静止图像压缩基础上再设法 减小邻近帧之间的相关性。 例:国际标准 MPEG-2 先将若干帧动态图像分为一组。 在每组中的帧分为3类:I-帧、P-帧和B-帧。 I-帧采用帧内编码 P-帧采用预测编码 B-帧采用双向预测编码
12
例3
像素为横条形,即 2 2 2 2 0 0 0 0 s 2 2 2 2 0 0 0 0
经过沃尔什变换后,在变换域中
1 S 16
2 0 2 0
2 2 2 0 0 0 2 2 2 0 0 0
16 0 1 16 0 16
wenku.baidu.com
0 0 0 0 0 0 0 0 0 0 0 0
矩阵S的非零元素仅在第一列。
13
17
字符 a b
码1 0 1
码2 1 01
码3 0 01
码4 0 10
c
11
11
011
110
唯一可译码又可以按照是否需要参考后继码元译码,分为 即时可译码和非即时可译码。 非即时可译码需要参考后继码元译码。例如,此表中的 “码3”是非即时可译码,因为当发送“ab”时,收到 “001”后,尚不能确定译为“ab”,还必须等待下一个 码元是“0”才能确定译为“ab”;否则应译为“ac”。 即时可译码又称无前缀码。无前缀码是指其中没有一个码 字是任何其它码字的前缀。
基音周期
清音:气流经过声门时,声带不振动
发声时,声道在变化,相当一个时变线性滤波器。
7
语音产生模型:
浊音 周期脉冲发生器 基音周期 Tp 随机噪声发生器 清音
H(z) U/V
时变线性滤波器 U(z) G 声道参量 M(z)
图12.2.2 语音产生模型 因说话慢,可以假设,在短时间(20ms)内,上图中5个 参量都是恒定的。 可将这5个参量,每20ms,编码传输;接收端再将收到的这5 个参量解码后,按照上图合成(恢复)原语音。 这种参量编码器称为声码器,典型编码速率为2.4 kb/s;但是 其恢复的语音失真较大。 目前,实用的语音编码方法,大多为混合编码方案。
概率
x1 0.2500 0.500 0 1 0 1
0.2500
0.2500 0.1250 0.1250 0.1250 0 0.2500
0.2500
0.2500 0.2500 0 0.2500 1
x2
x3 x4 X5 x6 x7 x8
0.2500
0.1250 0.1250 0.0625 0.0625 0.0625 0 0.1250 0.0625 1
0 0.500
1 编码得到的码字 X1 X2 X3 X4 X5 X6 X7 X8 10 11 010 011 0010 0011 0000 0001
20
0.0625 0 0.1250 1 0.0625 1
图12.4.1 霍夫曼编码举例
概率 0.2500
x1 x2 0.2500 0.1250 0.1250 0.0625 0.0625 0.0625 0.0625 x7 x8
8
12.2.2 混合编码 参量编码的主要缺点:激励模型过于简化,特别是忽略了浊 音和清音之间的过渡音:
混合编码的改进: 激励中加入语音波形的信息。 加入的方法有多种,广泛采用的方法有: 9.6kb/s的多脉冲激励线性预测编码; 13kb/s的规则脉冲激励-长时预测-线性预测编码; 4.8kb/s的码激励线性预测; 16kb/s的低时延码激励线性预测; 代数码书激励线性预测 以上方案中,不少方案采用了矢量量化编码的码激励。
矩阵S仅左上角元素为非零,它代表直流分量。
11
例2
像素为纵条形,即 2 0 2 0 2 0 2 0 s 2 0 2 0 2 0 2 0
经过沃尔什变换后,在变换域中
1 S 16
2 2 2 2
10
例1
像素均等于2,即
2 2 s 2 2 2 2 2 2 2 2 2 2 2 2 2 2
经过沃尔什变换后,在变换域中
1 S 16 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 32 0 1 16 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0.500
0 1
0.2500 0.2500
0.1250 0.1250 0.1250 0.0625
0.2500
0 1 0
0.500
16
例: 字符
表12.4.1 4种变长码 码1 码2 码3 码4
a
b c
0
1 11
1
01 11
0
01 011
0
10 110
信源字符表中包含3个字符a、b和c,为其设计出4种变长码 ,如上表所示。其中按“码1”编码产生的序列10111,在 接收端可以译码为babc或babbb或bacb;不能确定。按“ 码2”编码也有类似的结果。所以它们不是唯一可译码。可 以验证,表中“码3”和“码4”是唯一可译码。唯一可译 码必须能够逆映射为原信源字符。
I ( X ;Y ) 一般情况:
H (Y ) p log 2 p q log 2 q
S的非零元素主要集中在左上半区域,而右下半区 域中的元素值多为 0,或很小。在发送时,像素按照 C max[ I ( X ; Y )] 1 p log 2 p q log 2 q 1 H ( p ) “Z”字形次序发送,则右下半区域的长串“0”可以用 高效编码压缩。
0 2 0 0 2 0 0 2 0 0 2 0
16 0 1 16 0 0
0 0 16 0 0 0 0 0 0 0 0 0
矩阵S的非零元素仅在第一行。
(xi1, xj1) xi
00
q00
图12.1.1 4电平标量量化
图12.1.2 双抽样值标量量化
1
矢量量化:每次同时量化多个抽样值 例:2维矢量量化,将正方形 变成正六边形,最大量化误 差将降低。
qi
图12.1.3 二维矢量量化示意图
矢量量化器划分区域,使量化误差的统计平均值小于给定 值。
18
当采用二进制码字表示信源中的字符时,若字符x 的二进 制码长等于n ,则信源字符表X(N)的二进制码字的平均码 长等于 N 比特/字符 (12.4-1)
i i
n ni P xi
i 1
式中:P(xi)为xi出现的概率。 常见的唯一可译码有霍夫曼码、香农-费诺码等
19
霍夫曼码 性能:霍夫曼码是一种无前缀变长码。对于给定熵的信源, 霍夫曼码能得到最小平均码长。故在最小码长意义上霍夫 曼码是最佳码。因此,它也是效率最高的码。 例:用有8个字符的信源字符表来说明霍夫曼码的编码方法。 设信源的输出字符为x1, x2, x3, x4, x5, x6, x7和x8,其对应的 出现概率示于下图中:
图12.1.4 二维最佳矢量量化示意图
4
量化误差D: D = E[ d (x, qi) ] 式中 d 为失真测度。 失真测度d有不同的衡量准则: 平方失真测度:
d ( x , qi ) x j qij
j 1
n
2
绝对误差失真测度:
d ( x , qi ) x j qij
I B B P B BP B B I
GOP
P-帧和B-帧位于两个I-帧之间
15
12.4 数字数据压缩编码
12.4.1 基本原理 数据可以分为数字数据和模拟数据。 数字数据只能采用无损压缩的方法。 一个有限离散信源可以用一组不同字符xi (i = 1,2, …, N)的 集合X(N) 表示。X(N)称为信源字符表。 字符表可以是二字符的;也可以是多字符的,例如,计算 机键盘上的字母和符号。 若用等长的二进制码字表示字符表中的每个字符,但是各 字符所含有的信息量是不同的。含信息量小的字符的等长 码字必然有更多的冗余度,所以为了压缩,通常采用变长 码。 我们希望字符的码长反比于此字符出现的概率。 仅当所有字符以等概率出现时,其编码才应当是等长的。 变长码应该是唯一可译码。
j 1
n
5
矢量量化系统
失真测度
d(x, qi)
码书
码书
输入矢量 x
计算最小失真测度
min[d(x, qi)]
编码端
i
i
寻找 qi
译码端
qi
图12.1.5 矢量量化系统原理方框图
6
12.2 语音压缩编码
12.2.1 语音参量编码 发音器官: 次声门系统——肺、支气管、气管 声门——声带、声带间的区域 声道——咽腔、鼻腔、口腔及舌、唇、齿等 发音原理: 浊音:气流经过声门时,声带振动
第12章 信源压缩编码
12.1 矢量量化
标量量化:每个抽样值逐个量化。 例1:4电平标量量化 例2:双抽样值标量量化
量 化 值 10 m0 m1
x
xj q03 11 q02 q01
抽样值
q13
q23
q22 q21 q20
q33 q32 q31 q30
q3 q2 m2 01 q1 q0
q12
q11 q10
最佳n维矢量量化器的设计,是按照使量化误差最小的原 则,来划分区域Ri和选择量化值qi的。因为信号抽样值的 分布和其统计特性有关,一般都不是均匀分布的,若按照 图12.1.3那样均匀划分区域,显然不是最佳的。若在抽样值 密集的区域将量化区域划分的小些,而在抽样值稀疏的区 域将量化区域划分的大些,将有利于减小量化误差统计平 均值,如下图所示:
9
12.3 图像压缩编码
分类:有损压缩;无损压缩 静止图像压缩;动态图像压缩 12.3.1 静止图像压缩编码 原理:利用邻近像素的相关性 方法:常在变换域中作有损压缩,例如:沃尔什变换 先将数字图像的像素分割为44的子块方阵,再作2维 沃尔什变换: 1 S 2 WsW 4 式中 S --- 沃尔什变换系数矩阵;s --- 像素矩阵; W --- 沃尔什矩阵,其定义为 式中 “+”代表“+1” “−”代表“− 1” W
2
将n维欧氏空间划分为K个量化区域Ri;并将n个信源抽样 值分为一组,构成一个n维输入信号矢量x,若x落入区域 Ri ,则将其量化为量化矢量qi 。若对全部qi进行编号,则 用log 2 K 比特就足以表示这K个量化矢量的编号。在传输 时,不需要直接传输这些量化矢量,而只需要传输其编号, 即传输n个抽样值只需要log 2 K比特,故定义码率 R = (log 2 K ) / n 比特/抽样值 例12.1 用一个矢量量化器对语音信号抽样值量化,抽样速 率fs = 8 kb/s,量化器将量化空间划分为256个量化区域, 用8维矢量对抽样值进行量化。求该矢量量化器的码率和编 码信号传输速率。 解:现在K = 256,n = 8,由式(12.1-1)得出码率 R = (log2 256)/ 8 = 1 比特/抽样值 传输速率为 fs R = 8000 1 = 8000 比特/秒 上述K个量化矢量通常称为码字或码矢。全部量化矢量qi的 3 集合称为码书。
图12.3.1 像素发送次序
14
12.3.2 动态图像压缩编码 原理:动态数字图像是由许多帧静止图像构成的,可以看 成是三维的图像;在邻近帧的像素之间也有相关性。所以, 动态图像的压缩可以看作是在静止图像压缩基础上再设法 减小邻近帧之间的相关性。 例:国际标准 MPEG-2 先将若干帧动态图像分为一组。 在每组中的帧分为3类:I-帧、P-帧和B-帧。 I-帧采用帧内编码 P-帧采用预测编码 B-帧采用双向预测编码
12
例3
像素为横条形,即 2 2 2 2 0 0 0 0 s 2 2 2 2 0 0 0 0
经过沃尔什变换后,在变换域中
1 S 16
2 0 2 0
2 2 2 0 0 0 2 2 2 0 0 0
16 0 1 16 0 16
wenku.baidu.com
0 0 0 0 0 0 0 0 0 0 0 0
矩阵S的非零元素仅在第一列。
13
17
字符 a b
码1 0 1
码2 1 01
码3 0 01
码4 0 10
c
11
11
011
110
唯一可译码又可以按照是否需要参考后继码元译码,分为 即时可译码和非即时可译码。 非即时可译码需要参考后继码元译码。例如,此表中的 “码3”是非即时可译码,因为当发送“ab”时,收到 “001”后,尚不能确定译为“ab”,还必须等待下一个 码元是“0”才能确定译为“ab”;否则应译为“ac”。 即时可译码又称无前缀码。无前缀码是指其中没有一个码 字是任何其它码字的前缀。
基音周期
清音:气流经过声门时,声带不振动
发声时,声道在变化,相当一个时变线性滤波器。
7
语音产生模型:
浊音 周期脉冲发生器 基音周期 Tp 随机噪声发生器 清音
H(z) U/V
时变线性滤波器 U(z) G 声道参量 M(z)
图12.2.2 语音产生模型 因说话慢,可以假设,在短时间(20ms)内,上图中5个 参量都是恒定的。 可将这5个参量,每20ms,编码传输;接收端再将收到的这5 个参量解码后,按照上图合成(恢复)原语音。 这种参量编码器称为声码器,典型编码速率为2.4 kb/s;但是 其恢复的语音失真较大。 目前,实用的语音编码方法,大多为混合编码方案。
概率
x1 0.2500 0.500 0 1 0 1
0.2500
0.2500 0.1250 0.1250 0.1250 0 0.2500
0.2500
0.2500 0.2500 0 0.2500 1
x2
x3 x4 X5 x6 x7 x8
0.2500
0.1250 0.1250 0.0625 0.0625 0.0625 0 0.1250 0.0625 1
0 0.500
1 编码得到的码字 X1 X2 X3 X4 X5 X6 X7 X8 10 11 010 011 0010 0011 0000 0001
20
0.0625 0 0.1250 1 0.0625 1
图12.4.1 霍夫曼编码举例
概率 0.2500
x1 x2 0.2500 0.1250 0.1250 0.0625 0.0625 0.0625 0.0625 x7 x8
8
12.2.2 混合编码 参量编码的主要缺点:激励模型过于简化,特别是忽略了浊 音和清音之间的过渡音:
混合编码的改进: 激励中加入语音波形的信息。 加入的方法有多种,广泛采用的方法有: 9.6kb/s的多脉冲激励线性预测编码; 13kb/s的规则脉冲激励-长时预测-线性预测编码; 4.8kb/s的码激励线性预测; 16kb/s的低时延码激励线性预测; 代数码书激励线性预测 以上方案中,不少方案采用了矢量量化编码的码激励。
矩阵S仅左上角元素为非零,它代表直流分量。
11
例2
像素为纵条形,即 2 0 2 0 2 0 2 0 s 2 0 2 0 2 0 2 0
经过沃尔什变换后,在变换域中
1 S 16
2 2 2 2
10
例1
像素均等于2,即
2 2 s 2 2 2 2 2 2 2 2 2 2 2 2 2 2
经过沃尔什变换后,在变换域中
1 S 16 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 32 0 1 16 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0.500
0 1
0.2500 0.2500
0.1250 0.1250 0.1250 0.0625
0.2500
0 1 0
0.500
16
例: 字符
表12.4.1 4种变长码 码1 码2 码3 码4
a
b c
0
1 11
1
01 11
0
01 011
0
10 110
信源字符表中包含3个字符a、b和c,为其设计出4种变长码 ,如上表所示。其中按“码1”编码产生的序列10111,在 接收端可以译码为babc或babbb或bacb;不能确定。按“ 码2”编码也有类似的结果。所以它们不是唯一可译码。可 以验证,表中“码3”和“码4”是唯一可译码。唯一可译 码必须能够逆映射为原信源字符。
I ( X ;Y ) 一般情况:
H (Y ) p log 2 p q log 2 q
S的非零元素主要集中在左上半区域,而右下半区 域中的元素值多为 0,或很小。在发送时,像素按照 C max[ I ( X ; Y )] 1 p log 2 p q log 2 q 1 H ( p ) “Z”字形次序发送,则右下半区域的长串“0”可以用 高效编码压缩。
0 2 0 0 2 0 0 2 0 0 2 0
16 0 1 16 0 0
0 0 16 0 0 0 0 0 0 0 0 0
矩阵S的非零元素仅在第一行。
(xi1, xj1) xi
00
q00
图12.1.1 4电平标量量化
图12.1.2 双抽样值标量量化
1
矢量量化:每次同时量化多个抽样值 例:2维矢量量化,将正方形 变成正六边形,最大量化误 差将降低。
qi
图12.1.3 二维矢量量化示意图
矢量量化器划分区域,使量化误差的统计平均值小于给定 值。
18
当采用二进制码字表示信源中的字符时,若字符x 的二进 制码长等于n ,则信源字符表X(N)的二进制码字的平均码 长等于 N 比特/字符 (12.4-1)
i i
n ni P xi
i 1
式中:P(xi)为xi出现的概率。 常见的唯一可译码有霍夫曼码、香农-费诺码等
19
霍夫曼码 性能:霍夫曼码是一种无前缀变长码。对于给定熵的信源, 霍夫曼码能得到最小平均码长。故在最小码长意义上霍夫 曼码是最佳码。因此,它也是效率最高的码。 例:用有8个字符的信源字符表来说明霍夫曼码的编码方法。 设信源的输出字符为x1, x2, x3, x4, x5, x6, x7和x8,其对应的 出现概率示于下图中:
图12.1.4 二维最佳矢量量化示意图
4
量化误差D: D = E[ d (x, qi) ] 式中 d 为失真测度。 失真测度d有不同的衡量准则: 平方失真测度:
d ( x , qi ) x j qij
j 1
n
2
绝对误差失真测度:
d ( x , qi ) x j qij
I B B P B BP B B I
GOP
P-帧和B-帧位于两个I-帧之间
15
12.4 数字数据压缩编码
12.4.1 基本原理 数据可以分为数字数据和模拟数据。 数字数据只能采用无损压缩的方法。 一个有限离散信源可以用一组不同字符xi (i = 1,2, …, N)的 集合X(N) 表示。X(N)称为信源字符表。 字符表可以是二字符的;也可以是多字符的,例如,计算 机键盘上的字母和符号。 若用等长的二进制码字表示字符表中的每个字符,但是各 字符所含有的信息量是不同的。含信息量小的字符的等长 码字必然有更多的冗余度,所以为了压缩,通常采用变长 码。 我们希望字符的码长反比于此字符出现的概率。 仅当所有字符以等概率出现时,其编码才应当是等长的。 变长码应该是唯一可译码。
j 1
n
5
矢量量化系统
失真测度
d(x, qi)
码书
码书
输入矢量 x
计算最小失真测度
min[d(x, qi)]
编码端
i
i
寻找 qi
译码端
qi
图12.1.5 矢量量化系统原理方框图
6
12.2 语音压缩编码
12.2.1 语音参量编码 发音器官: 次声门系统——肺、支气管、气管 声门——声带、声带间的区域 声道——咽腔、鼻腔、口腔及舌、唇、齿等 发音原理: 浊音:气流经过声门时,声带振动
第12章 信源压缩编码
12.1 矢量量化
标量量化:每个抽样值逐个量化。 例1:4电平标量量化 例2:双抽样值标量量化
量 化 值 10 m0 m1
x
xj q03 11 q02 q01
抽样值
q13
q23
q22 q21 q20
q33 q32 q31 q30
q3 q2 m2 01 q1 q0
q12
q11 q10
最佳n维矢量量化器的设计,是按照使量化误差最小的原 则,来划分区域Ri和选择量化值qi的。因为信号抽样值的 分布和其统计特性有关,一般都不是均匀分布的,若按照 图12.1.3那样均匀划分区域,显然不是最佳的。若在抽样值 密集的区域将量化区域划分的小些,而在抽样值稀疏的区 域将量化区域划分的大些,将有利于减小量化误差统计平 均值,如下图所示:
9
12.3 图像压缩编码
分类:有损压缩;无损压缩 静止图像压缩;动态图像压缩 12.3.1 静止图像压缩编码 原理:利用邻近像素的相关性 方法:常在变换域中作有损压缩,例如:沃尔什变换 先将数字图像的像素分割为44的子块方阵,再作2维 沃尔什变换: 1 S 2 WsW 4 式中 S --- 沃尔什变换系数矩阵;s --- 像素矩阵; W --- 沃尔什矩阵,其定义为 式中 “+”代表“+1” “−”代表“− 1” W
2
将n维欧氏空间划分为K个量化区域Ri;并将n个信源抽样 值分为一组,构成一个n维输入信号矢量x,若x落入区域 Ri ,则将其量化为量化矢量qi 。若对全部qi进行编号,则 用log 2 K 比特就足以表示这K个量化矢量的编号。在传输 时,不需要直接传输这些量化矢量,而只需要传输其编号, 即传输n个抽样值只需要log 2 K比特,故定义码率 R = (log 2 K ) / n 比特/抽样值 例12.1 用一个矢量量化器对语音信号抽样值量化,抽样速 率fs = 8 kb/s,量化器将量化空间划分为256个量化区域, 用8维矢量对抽样值进行量化。求该矢量量化器的码率和编 码信号传输速率。 解:现在K = 256,n = 8,由式(12.1-1)得出码率 R = (log2 256)/ 8 = 1 比特/抽样值 传输速率为 fs R = 8000 1 = 8000 比特/秒 上述K个量化矢量通常称为码字或码矢。全部量化矢量qi的 3 集合称为码书。