信息论基础——信源编码

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

若对上述信源采用等长编码，要做到无失真译码，每个符号至少要用3 个比特表示。相比较，香农编码对信源进行了压缩。由离散无记忆信源熵定义，可计算出：
H ( X ) p( xi ) log 2 p( xi ) 2.42(比特 / 符号)
i 1 6

对上述信源采用香农编码的信息率为 L 2.7 R log 2 m log 2 2 2.7 L 1 可以看出，编码效率并不是很高。
34Leabharlann 数据压缩和信源编码3.1 等长码 3.2 变长编码 3.3 哈夫曼码香农-费诺码;香农-费诺-埃里斯码 3.4 算术码 3.5 通用信源编码习题三
35
编码理论（实例）
以数字电视这一热门话题为例.
36
编码理论（实例）
数字电视的主要核心技术包括信源编码、信道编码和显示技术，它们分别解决数字电视节目在初始制作、中间传播和终端呈现三个主要环节上的问题。通俗地说就是满足了我们拍片子、播节目、看电视的需要。
29
算术码—Shannon-Fano-Elias码
思考（二）：信源X的Shannon-Fano-Elias编码： 7 其平均码长 LX p( xi )li 3.14
i 1
H(X ) 83.1% 编码效率 X LX
30
算术码—Shannon-Fano-Elias码
思考（二）：信源Y的Shannon-Fano-Elias码： 9 其平均码长 LY p( xi )li 2.89
思考（二）：信源X的二元霍夫曼编码： 7 其平均码长 LX p( xi )li 2.72
i 1
H(X ) 95.9% 编码效率 X LX
20
算术码—Shannon-Fano-Elias码
思考（二）：信源Y的二元霍夫曼编码：
21
算术码—Shannon-Fano-Elias码
x2 , x3 , x4 , x5 , x6 X x1 , P ( X ) 0.25 0.25 0.20 0.15 0.10 0.05
对该信源编二进制香农-费诺码.
其编码过程如下表所示：
12
算术码—Shannon-Fano-Elias码
二进制香农编码 xi x1 x2 x3 x4 x5 x6 p(xi) 0.25 0.25 0.20 0.15 0.10 0.05 pa(xj) 0.125 0.375 0.60 0.775 0.90 0.975 li 3 3 4 4 5 6 码字 001 011 1001 1100 (0.001)2 (0.011)2 (0.10011)2 (0.110001)2
4）将F(ak)表示为二进制小数，并用小数点后的l(ak) 位作为ak的码字. <若后面有尾数，要进位> 若二进制小数后面有尾数，则截断
8
1 l (ak ) log 1 p (ak )
算术码—Shannon-Fano-Elias码
x1 , x2 例1：若信源的概率分布为，取信 1,3 4 4 号字母表为 U 0,1，求信源的算术码.

39
编码理论（实例）
数字音视频要在消费电子产品中得到应用，必须采用先进的压缩编码算法进行大幅度压缩。而反映压缩效率的压缩比也就成为数字电视乃至数字音视频产业的“基本指数”。
40
编码理论（实例）
打个形象的比方，信源编码就好像制作压缩饼干的技术，如何将普通面粉制作成压缩饼干就是“编码”过程——挤掉冗余成分，只保留有效成分且体积（或所占用资源）尽可能小；而“译码”就是一个还原过程，将压缩饼干恢复到常态供给食用，并保证营养（或信息）损失尽可能少。
2
算术码—Shannon-Fano-Elias码
例 1
3
算术码—Shannon-Fano-Elias码
0.概述
平均码长：0.25×2+0.20×2+0.15×3+0.15×3+0.10×3+ 0.10×4+0.05×4=2.7 bits/symbol. 熵：-（0.25log0.25+0.20log0.20+0.15log0.15+0.15log 0.15+0.10log0.10+0.10log0.10+0.05log0.05≈2.67. 这是一个较好的结果！
i 1
H (Y ) 80.1% 编码效率 Y LY
31
算术码—Shannon-Fano-Elias码
思考（二）：从信源X和Y的三种不同编码方法可以看出： Huffman编码所得平均码长最短，编码效率最高；Shannon-Fano-Elias编码所得平均码长最长，其编码效率最差；而Shannon-Fano 码居中。
111001 (0.1110011)2 111110 (0.1111100)2
13
算术码—Shannon-Fano-Elias码

计算出给定信源香农码的平均码长
L 0.25 2 2 (0.2 0.15) 3 0.10 4 0.05 5 2.7(比特 / 符号)
这里L 1, m 2
H ( X ) 2.42 89.63% R 2.7
14

编码效率为信源熵和信息率之比。则
算术码—Shannon-Fano-Elias码
思考（一）：用Shannon-Fano-Elias码方法将信源
a2 a3 a4 a5 a6 a7 X a1 p( x) 0.20 0.19 0.18 0.17 0.15 0.10 0.01
编成二元变长唯一可译码，并计算其码率.
15
算术码—Shannon-Fano-Elias码
思考（二）：有两个信源X和Y如下：
1)分别用霍夫曼码编成二元变长惟一可译码，并计算其编码效率。 *)用Shannon-Fano码编成二元变长惟一可译码
16
算术码—Shannon-Fano-Elias码
思考（二）：有两个信源X和Y如下：
7
算术码—Shannon-Fano-Elias码
2.编码方法
1）将信源符号X={a1,a2,……,aq}依次排列（不要求以概率大小排序）； 2）计算各符号的修正累积分函数值
F ( x ak ) p(ai )
i 1 k 1
1 p(ak ) 2
[x]代表不小于x的整数
3）确定各信源符号所对应码字的码长
2)分别用Shannon-Fano-Elias编码法编成二元变长惟一可泽码．并计算编码效率. 3)从X，Y两种不同信源来比较这三种编码方法的优缺点
17
算术码—Shannon-Fano-Elias码
思考（二）：信源X的二元霍夫曼编码：
18
算术码—Shannon-Fano-Elias码
19
算术码—Shannon-Fano-Elias码
37
编码理论（实例）
信源编码技术解决的重点问题是数字音视频海量数据的编码压缩问题。
众所周知，数字化视频的原始数据量是十分庞大的，例如，标准清晰度的数字视频每秒的数据量超过200M bit，高清晰度数字电视每秒的数据量超过1G bit。

38
编码理论（实例）
信源编码技术解决的重点问题是数字音视频海量数据的编码压缩问题。
思考（二）：信源Y的Shannon-Fano码：
27
算术码—Shannon-Fano-Elias码
28
算术码—Shannon-Fano-Elias码
思考（二）：信源Y的Shannon-Fano码： 9 其平均码长 LY p( xi )li 2.33
i 1
H (Y ) 99.3% 编码效率 Y LY
33
算术码—Shannon-Fano-Elias码
Shannon-Fano码也是一种较好的编码方法．如信源Y的Shannon-Fano码与Huffman 码的编码效率一样好。而信源X的ShannonFano码的编码效率比其Huffman码的编码效率降低极少。这是因为信源Y在ShannonFano码编程过程中分两大组时“概率和” 相差不多(为0.49与0.51)：而信源X在编码过程中每次分两组时，其“概率和”相差较远(第一次为0.57和0.43；第二次上面分组为 0 . 2 和 0.37，下面分组为0.17和0.26)。
32
算术码—Shannon-Fano-Elias码
Huffman码其编码时短码得到充分利用，而且一定是概率大的信源符号对应于短码，概率小的信源符号对应于长码：所以，其平均码长最短。 Shannon-Fano-Elias编码方法虽然概率大的符号其码长短，概率小的符号其码长长，但它短码没有被充分利用。所以，其平均码长增大。
4
算术码—Shannon-Fano-Elias码
例 2
5
算术码—Shannon-Fano-Elias码
例 3
x1 , x2 1 3 , 4 4
6
算术码—Shannon-Fano-Elias码 1.基本思路
用二进制小数表示信源的概率分布，如果概率分布取值大，则它的二进制位数就低；另外，为了使算术码具有前缀性（无尾随后缀），对概率分布采用累计求和计算.
9
算术码—Shannon-Fano-Elias码
x1 , x2 例1：若信源的概率分布为，取信 1,3 4 4 号字母表为 U 0,1，求信源的算术码.
F ( x1 ) 1 1 p( x1 ) 0.125 (0.001)2 2 8
1 5 p( x2 ) 0.625 (0.10)2 2 8
高清晰度数字电视简称高清电视（HDTV）简单的说，是指图像水平清晰度大于720线、采用的是16:9显示方式的数字电视系统。从世界范围来看，目前高清电视主要包括1080i和 720p这两种格式，两者图像的长宽比都是16：9，因此这符合人眼视觉的“黄金分割法则”。作为隔行扫描的1080i的分辨率则是1920×1080；720p是逐行扫描，分辨率为1280×720。
22
算术码—Shannon-Fano-Elias码
思考（二）：信源Y的二元霍夫曼编码： 9 其平均码长 LY p( xi )li 2.33
i 1
H (Y ) 99.3% 编码效率 Y LY
23
算术码—Shannon-Fano-Elias码
思考（二）：信源X的Shannon-Fano编码：
10
F ( x2 ) p( x1 )
算术码—Shannon-Fano-Elias码
x1 , x2 例1：若信源的概率分布为，取信 1,3 4 4 号字母表为 U 0,1，求信源的算术码.
10
11
算术码—Shannon-Fano-Elias码
例2 有一单符号离散无记忆信源
数据压缩和信源编码
3.1 等长码 3.2 变长编码 3.3 哈夫曼码 3.4 算术码 3.5 通用信源编码习题三
香农-费诺码 LZW算法
1
算术码—Shannon-Fano-Elias码
0.概述
是第一个能够找到的好的变长码.
原则：按照符号出现的概率从大到小排序，然后将其分成两个出现概率相同或几乎相同的子集—一个子集的编码均以0打头，另一个子集的编码均以1打头；然后把每个子集再分成两个更小的子集，同样确定所有码字的第二位，依次循环.
41
编码理论（实例）
MP3（MPEG Audio Layer）是一种以高保真为前提下实现的高效压缩技术。它采用了特殊的数据压缩算法对原先的音频信号进行处理，使数码音频文件的大小仅为原来的十几分之一，而音乐的质量却没有什么变化，几乎接近于CD唱盘的质量。一分钟的WAVE格式的文件有十几兆，而一分钟MP3格式的音频文件仅有一兆左右。
24
算术码—Shannon-Fano-Elias码
25
算术码—Shannon-Fano-Elias码
思考（二）：信源X的Shannon-Fano编码： 7 其平均码长 LX p( xi )li 2.74
i 1
Hr ( X ) 95.2% 编码效率 X LX
26
算术码—Shannon-Fano-Elias码