第三章数据压缩和信源编码讲义

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

03:43
7
信源编码
编码定理证明：
（1）必存在一种编码方法，使代码的平均长度可任意接近但不能低于符号熵
（2）达到这目标的途径，就是使概率与码长匹配。
说明：
（1）无失真编码或可逆编码只适用于离散信源。
（2）对于连续信源，编成代码后就无法无失真地恢复原来的连续值，因为后者的取值可有无限多个。此时只能根据限失真编码定理进行限失真编码。
在一组码字集合C中的所有码字cm (m = 1,2, …,M)，其码长都相同，则称这组码C为等长码。
3. 变长码
若码字集合C中的所有码字cm (m = 1,2, …,M)，其码长不都相同，称码C为变长码。
Hale Waihona Puke 03:43184.非奇异码
从信源消息到码字的映射是一一对应的，每一个不同的信源消息都用不同的码字对其编码。非奇异码码中所有码字互不相同.
03:43
13
信源编码的分类
•熵压缩编码：是不可逆压缩压缩超过一定限度，必然带来失真,允许的失真越
大，压缩的比例越大,译码时能按一定的失真容许度恢复，保留尽可能多的信息。
03:43
14
信源编码器模型
信源编码将信源符号序列按一定的数学规律映射成码符号序列。是从信源符号集到码符号集的一种映射，它把信源输出的符号变换成码元序列。
5.奇异码
从信源消息到码字的映射不是一一对应的。奇异码不具备惟一可译性。
6.原码C的N次扩展码
原码的N次扩展码是将信源作N次扩展得到的新信源符号序列
• 编码分为信源编码和信道编码，其中信源编码又分为无失真信源编码和限失真信源编码。无失真信源编码：适用于离散信源或数字信号。限失真信源编码：主要用于连续信源或模拟信号，如语音、图像等信号的数字处理。
03:43
3
香农信息论三大定理
• 第一极限定理:无失真信源编码定理. • 第二极限定理:信道编码定理（包括离散和连
§3.1 等长码 §3.2 变长编码 §3.3 哈夫曼码 §3.4 香农码和费诺玛
03:43
1
数据压缩和信源编码
为了实现高质量、高效率的通信，引入了信源编码和信道编码。信源编码和信道编码主要需要解决以下两个问题。
提高传输效率
增强通信的可靠性
03:43
2
编码、信源编码、信道编码
• 编码：将一定的符号，数字或字母按一定的要求编成不同的序列，表示出一定的意义称为编码。
射成某一个码字，ci这样的码称为分组码。
只有分组码才有对应的码表，而非分组码中则不存在码表。
对于同一个信源，编码方法是多种的。
03:43
17
码的分类
1. 二元码
若码符号集为{0，1}，则码字就是二元序列，称为二元码,二元码通过二进制信道传输，这是数字通信和计算机通信中最常见的一种码。
2. 等长码
信源
编码器
信道
译码器
信宿
信源编码器模型
• 译码是从码符号到信源符号的映射。若要实现无失真编码，这种映射必须是一一对应的、可逆的。
03:43
15
信源编码器的模型
X X1, X 2, , X q
编码器
C {c1, c2 , , cq}
X :{x1, x2,..., xD}
码字 ci x xi1 i2 xili
03:43
8
信道编码、密码
• 信道编码：
是以提高信息传输的可靠性为目的的编码。在信道受干扰的情况下如何增加信号的抗干扰能力,同时又使得信息传输率最大。通常通过增加信源的冗余度来实现。采用的一般方法是增大码率/带宽。与信源编码正好相反。
• 密码：
是以提高通信系统的安全性为目的的编码。通常通过加密和解密来实现。从信息论的观点出发“加密” 可视为增熵的过程,“解密”可视为减熵的过程。
03:43
11
信源编码的分类
信源编码的分类：离散信源编码、连续信源编码和相关信源编码三类
离散信源编码：独立信源编码，可做到无失真编码；连续信源编码：独立信源编码，只能做到限失真信源编码；相关信源编码：非独立信源编码。
03:43
12
信源编码的分类
• 冗余度压缩编码: 是可逆压缩，经编译码后可以无失真地恢复。基本途径：压缩信源的冗余度，即 1) 去除码符号间的相关性； 2) 使码符号等概分布。
03:43
5
信源编码
• 信源编码的基本途径是什么?
信源编码的基本途径有两个，一是使序列中的各个符号尽可能地互相独立，即解除相关性；二是使编码中各个符号出现的概率尽可能地相等，即概率均匀化。
• 信源编码的基础是什么?
信源编码的基础是：两个编码定理，即无失真编码定理和限失真编码定理。
03:43
将信源符号集中的符号X（i 或者长为n的信源符号序
列）映射成由码符号xi 组成的长度为li 的一一对应的码符号序列 ci 。
03:43
16
分组码
编码器输出的码符号序列 ci称为码字；长度称li 为码字长度，简称码长；全体码字的集合记为C。
将信源符号集中的每个信源符号 X依i 照固定的码表映
续信道）. • 第三极限定理:限失真信源编码定理.
03:43
4
信源编码
• 信源编码的主要任务是什么?
• 由于信源符号之间存在分布不均匀和相关性，使得信源存在冗余度，信源编码的主要任务就是减少冗余，提高编码效率。具体说，就是针对信源输出符号序列的统计特性，寻找一定的方法把信源输出符号序列变换为最短的码字序列。
6
信源编码
信源编码：以提高通信有效性为目的,针对信源的编码.能更加有效地传输、存储信息。
在不失真或允许一定失真条件下,如何用尽可能少的符号来传送信源信息,以便提高信息传输率。通常通过压缩信源的冗余度来实现。
采用的一般方法是压缩每个信源符号的平均比特数或信源的码率。即同样多的信息用较少的码率传送,使单位时间内传送的平均信息量增加,从而提高通信的有效性。
03:43
9
信源编码包括两个功能：
（1）将信源符号变换成适合信道传输的符号；
（2）压缩信源冗余度，提高传输效率。提高传输效率往往削弱了其抗干扰能力。提高抗干扰能力往往是以降低信息传输效率为代价。
03:43
10
信源编码
由信源的渐近等分性导出了信源编码定理：只要编码的码率大于信源的熵（或熵率），则必存在编译码方案,使当被编码的信源分组长趋于无穷时,译码误差概率可以充分小,这解决了最优码的存在性问题。怎样构造最优码？