第5章限失真信源编码
第5章无失真信源编码定理
如果我们要对信源的N次扩展信源进行编码,也必须满足
qN rl , 两边取对数得: l log q
l
N log r
N 表示平均每个信源符号所需的码符号个数。
5.2 等长码
例:对英文电报得32个符号进行二元编码,根据上述关系:
l log 32 5 log 2
我们继续讨论上面得例子,我们已经知道英文的极限 熵是1.4bit,远小于5bit,也就是说,5个二元码符号只携带 1.4bit的信息量,实际上,5个二元符号最多可以携带5bit 信息量。我们可以做到让平均码长缩短,提高信息传输率
0.8112
0.4715
若采用等长二元编码,要求编码效率 0.96 ,允许错误率
105 ,则: N 4.13107
也就是长度要达到4130万以上。
5.5 变长码
1、唯一可译变长码与及时码
信源符号 出现概率 码1
码2
码3
码4
s1
1/2
0
0
1
1
s2
1/4
11
10
10
01
s3
1/8
00
00
密码:是以提高通信系统的安全性为目的的编码。通常通过加 密和解密来实现。从信息论的观点出发,“加密”可视为增熵 的过程,“解密”可视为减熵的过程。
5.1 编码器
信源编码理论是信息论的一个重要分支,其理论基础是信源编 码的两个定理。 无失真信源编码定理:是离散信源/数字信号编码的基础; 限失真信源编码定理:是连续信源/模拟信号编码的基础。
5.1 编码器
信源编码:以提高通信有效性为目的的编码。通常通过压缩信 源的冗余度来实现。采用的一般方法是压缩每个信源符号的平 均比特数或信源的码率。即同样多的信息用较少的码率传送, 使单位时间内传送的平均信息量增加,从而提高通信的有效性。
第5章 限失真信源编码
R(D) min I(X ;Y) min
Pij PD
Pij PD
n i1
m j 1
p(xi
)
p( y
j
/
xi
) log
p(y j / p( y j
xi) )
其单位是比特/信源符号。
应当注意,在研究R(D)时,我们引用的条件概 率 p(y / x)并没有实际信道的含义,只是为了求
平均互信息的最小值而引用的、假想的可变试
第5章 限失真信源编码
1. 信息率失真函数
2. 限失真信源编码定理
3. 常用信源编码方法
第三章我们讨论了无失真信源编码。但是,在很多 场合,特别是对于连续信源,因为其绝对熵为无限 大,若要求无失真地对其进行传输,则要求信道的 信息传输率也为无限大,这是不现实的。因此也就 不可能实现完全无失真传输。
显然或者是最小值不变,或者是变小了,所以 R(D)是非增的。
关于R(D)的连续性,这里我们就不再证明了。 所以,R(D)有如下基本性质: • R(D) 0,定义域为 0 ~ Dma,x 当 D Dm时ax ,
R(D)=0。 • R(D)是关于D的连续函数。 • R(D)是关于D的严格递减函数。
因此,当规定了允许失真,又找到了适当的失真
函数 dij ,就可以找到该失真条件下的最小信息
率R(D),用不同的方法进行数据压缩时(在允 许的失真限度D内),其压缩的程度如何,可以 用R(D)来衡量。由它可知是否还有压缩潜力, 有多大的压缩潜力。因此,有关R(D)的研究也 是信息论领域的一个研究热点。
0 1
1 0
求 Dmax
解:Dmax min d ' ( y) min p(x)d (x, y)
信息论与编码第5章限失真信源编码
第一节 失真测度
• 以上所举的三个例子说明了具体失真度的定义. 一般情况下根据实际信源的失真, 可以定义不同 的失真和误差的度量.
• 另外还可按照其他标准, 如引起的损失、风险、 主观感受上的差别大小等来定义失真度d(ui,vj).
• 从实用意义上说, 研究符号实际信源主观要求的、 合理的失真函数是很重要的.
第一节 失真测度
设信源变量为U={u1,…,ur}, 接收端变量为 V={v1,…,vs}, 对于每一对(u,v), 指定一个非负 函数
d(ui,vj)≥0 称为单个符号的失真度(或称失真函数). 失真函数用来表征信源发出符号ui, 而接收端再现 成符号vj所引起的误差或失真. d越小表示失真越小, 等于0表示没有失真.
➢ 应该指出, 研究R(D)时, 条件概率p(v|u)并没有 实际信道的含义. 只是为了求互信息的最小值而引 用的、假想的可变试验信道. ➢ 实际上这些信道反映的仅是不同的有失真信源编 码或信源压缩. 所以改变试验信道求平均互信息最 小值, 实质上是选择编码方式使信息传输率为最小.
率失真理论与信息传输理论的对偶关系
– 接收端获得的平均信息量可用平均互信息量I(U;V)表示;
– 这就变成了在满足保真度准则的条件下 D D 找平均互信息量I(U;V)的最小值.
,寻
– 因为BD是所有满足保真度准则的试验信道集合, 即可以 在D失真许可的试验信道集合BD中寻找某一个信道 p(vj|ui), 使I(U;V)取最小值.
本章所讨论的内容是量化、数模转换、频带 压缩和数据压缩的理论基础.
前言
本章主要介绍信息率失真理论的基本内容, 侧 重讨论离散无记忆信源.
首先给出信源的失真度和信息率失真函数的定 义与性质, 然后讨论离散信源的信息率失真函数计 算. 在这个基础上论述保真度准则下的信源编码定 理.
第5章限失真信源编码.
第5章 限失真信源编码
例 题:
0 1 1/2 删除信道 X {0 , 1} , Y {0 , 1, 2} , D ,求 Dmin 1 0 1/2
5.2 信息率失真函数
第5章 限失真信源编码
5.2.1 信息率失真函数的一般概念
如果信源和失真度给定,则根据式( 5-3) , D 就只与信道特性有关,把所有满足保真度 准则 D ≤ D 的信道集中起来,构成一个所谓 D 失真允许的试验信道集合,记为 PD ,即:
PD = p( y j | xi ); D ≤ D ; i = 1 , 2 , , m ; j = 1 , 2 , ,n
yn p( y 2 ) p( y n ) y2
对于每一对 ( xi , y j ) ,指定一个非负的函数 d ( xi , y j ) ≥ 0, i 1 , 2 , , m ; j 1 , 2 , , n , 称 d ( xi , y j ) 为单位符号的失真度或失真函数,用它来表示信源发出一个符号 x i ,而在接收端再 现为 y j 所引起的误差或失真的大小。通常较小的 d 值代表较小的失真,而 d ( xi , y j ) 0 表示没 有失真。由于信源 X 有 m 个符号,信道传输 Y 有 n 个符号,所以 d ( xi , y j ) 有 m n 个,这 m n 个非负的函数可以排列成矩阵形式,即:
第5章 限失真信源编码
汉明失真矩阵 D 通常为方阵,且对角线上的元素为 0。即:
0 1 D 1
D 是 m m 阶方阵。
例 题:
1 1 1 0 1 1 1 1 0
设信道输入 X {0 , 1} ,输出 Y {0 , 1 , 2} ,规定失真函数 d (0 , 0) d (1 , 1) 0 , d (0 , 1) d (1 , 0) 1 , d (0 , 2) d (2 , 0) 0.5 ,求 D 。 解:由失真函数和失真矩阵可得出:
第五章信源编码(编码定义及定长编码)
所以送一个信源符号x需要的平均信息率为:
K KL logm L
信息率最小就是找到一种编码方式使
KL logm L
最小。
5.2.1定长编码定理
定义:各个码字码长都相等的码 定长码中每个码字长度相等,所以只要定长码是非奇异
码,则必为唯一可译码
非奇异码 唯一可译码
即时码
非奇异码 唯一可译码
即时码
变长码
等长码
消息
概率
C1
C2
C3
C4
C5
C6
u1
1/2
000
0
0
0
1
01
u2
1/4
001
01
10
10
000
001
u3
1/16
010
011
110
1101 001
100
u4
1/16
011
0111 1110 1100 010
101
u5
1/16
100
01111 11110 1001 110
110
u6
1/16
101
解码:按照码符号的顺序,从根节点依次查询到终端节点,就得到对应的 信源符号。再从根节点对剩下的码符号序列做相同的处理,直到处理完码 符号序列中所有的码符号
对应表中的码4分析
A01Fra bibliotek01
1
0
0
1
0
10 1
0
1
000
001 010
011 100 101 110
111
一阶节点 二阶节点 三阶节点
唯一可译码存在的充要条件
我们之后介绍的是二元信道中的编码。
第5章2无失真和限失真信源编码
28
5.2.3
最佳变长编码
最佳变长编码 凡是能载荷一定的信息量,且码字的 平均长度最短,可分离的变长码的码字集 合称为最佳变长码。
29
5.2.3
最佳变长编码
能获得最佳码的编码方法主要有:
香农(Shannon)
费诺(Fano)
哈夫曼(Huffman)等
30
5.2.3
最佳变长编码
2
2.83
7.11
Pe=0.04 太大
16
5.2.1
定长编码定理
0.28
H(X ) = 0.90, H(X )
2 8 i 1
( X ) D[ I ( xi )] pi (log pi ) 2 [ H ( X )]2 7.82(bit) 2
若要求译码错误概率 10-6
对于平均符号熵为 HL(X) 的离散平稳 无记忆信源,必存在一种无失真编码方法, 使平均信息率满足不等式
H L (X) K H L (X)
其中为任意小正数。
20
5.2.2
变长编码定理
用变长编码来达到相当高的编码效率, 一般所要求的符号长度 L可以比定长编码小得 多。 编码效率的下界:
编码。
12
5.2.1
定义
定长编码定理
H L ( X) K
为编码效率,即信源的平均符号熵为H(X), 采用平均符号码长为 来编码,所得的效 K 率。 编码效率总是小于1,且最佳编码效率为
H L ( X) , 0 H L ( X)
13
5.2.1
定长编码定理
编码定理从理论上阐明了编码效率接 近1的理想编码器的存在性,它使输出符号 的信息率与信源熵之比接近于1,即
[工学]信息论与编码_第5章有失真信源编码
13
5.1 信息率失真函数
有失真信源编码器模型
X
信源编码器
Y
xi{a1,,an}
yj{b1,,bm}
假想信道
信源编码器 有干扰的假想信道 信息传输率R I(X;Y)
14
5.1 信息率失真函数
nm
D
p(ai ) p(bj | ai )d (ai , bj )
例5.1.1. 设信源符号X{0,1}, 编码器输出符号Y{0,1,2}, 规定失真函数为
d(0,0 )= d(1,1)=0 d(0,1 )= d(1,0)=1 d(0,2 )= d(1,2)=0.5 则失真矩阵为
d
0 1
1 0
0.5
0.5
.
6
a1
b1
a2
b2
an
bn
1
0 i j
8
5.1 信息率失真函数
均方失真: d(xi , yj ) (xi yj )2 绝对失真: d(xi , y j ) | xi y j |
相对失真: d(xi , y j ) | xi y j | | xi | 误码失真(适用于离散信源):
适用于连续信源
0,
i1 j1
若p(ai)和d(ai,bj)已定,则平均失真由信道转移概率{p(bj|ai)} 完全确定,所有满足平均失真小于等于门限D的信道集合
PD p(bj | ai ) : D D,1 i n,1 j m
15
5.1 信息率失真函数
信息率失真函数
R(D) min I (X ,Y ) PD
允许压缩信源输出的信息率。
研究内容:信息率
第五章信源编码
(每个符号有m种可能值)进行定长编码。对任意的 0,0
只要
KLHL(X)ε L logm
,则:当L足够大时,必可使译码差
错小于 (几乎无失真编码);反之,当 KLHL(X)2ε L logm
时,译码差错一定是有限值,而当L足够大时,译码几乎必定 出错(译码错误概率接近于1)。
1、解释: KL/L-----编码时,每个信源符号输出的 码长。即每个信源符
其中:左边--KL长码字所能携带的最大信息量, 右边--L长信源序列携带的信息量。
定理表明,只要码字所能携带的信息量大于信源序列输出的信 息量,则可以实现几乎无失真编码,当然条件是L足够大。 反之,不可能实现无失真的编码,也就是不可能做一种编码 器,能使收端译码时差错概率趋于零。
2、举例: (1 单 ) 符号 X A 信 {a1,a源 2...8} ., .n,a 8 ,等,L 概 1 。 分 H 1(X )H (X )lb3 8b /信 it 源符号。 若进行二进B制 {0编 ,1}m ,码 2,据定理,只要 K LLKLH lo(X g)m 3码元 /信源符号,就 无可 失以 真实 编现 码 事实上 3位,二进制码确实示 可8种 以信 表源符号。
或映射规则 元 b 转 j,j换 1,2..m 成 .构由 成码 的码 (也元 称序 为列
y i,i1,2..n.L。
f:xiyi
码K 长 L, i i1,2..n.L .; 平 均_KL 码 nL长 KLPi(: yi)码/元 符 号 序
i1 _
定长编 KL1 码 KL: 2...K .L .L n.KL, KLKL
注:奇异码一定非惟一可译。(非奇异码则不一定)
4、即时码和非即时码:
收到一个完整的码字后能立即译码,或曰及时可译---即时码
信息论:第5章 无失真信源编码定理
(4)非奇异码 若一组码中所有码字都不相同(即所有信源符 号映射到不同的码符号序列),则称为非奇异码。
si s j Wi W j
则称码C为非奇异码。
si , s j S Wi ,W j C
20
(5)奇异码
若一组码中有相同的码字,则为奇异码。
si s j Wi W j
30
即时码(异前缀码)一定是唯一可译码。因为,如果没 有一个码字是其他码字的前缀,则在译码过程中,当收到一 个完整码字的码符号序列时,无需考虑下一个符号,就能直 接把它译成对应的码字或信源符号。
31
32
33
5.2
等长码
一般说来,若要实现无失真的编码,这不但要求 信源符号与码字是一一对应的,而且要求码符号序 列的反变换也是唯一的。也就是说,所编的码必须 是唯一可译码。否则,所编的码不具有唯一可译码 性,就会引起译码带来的错误与失真。
11
超过信宿的灵敏度和分辨力所传送的信息是毫无 意义的,也是完全没有必要的。 比如话声信源,界别过多的划分,人耳就很难分 辨。图像信源亦是如此,人们看电影,当图片超过每 秒25张以上时,人眼就能将离散的照片在人脑内反映 成连续画面。
此时,就应该引入限定失真条件下的信源编码问题 。
12
5.1
编码器
32272781179同样可以求得信源序列长度增加到3和4时进行变长编码所得的编码效率和信息传输率分别为如果对这一信源采用等长二元码编码要求编码效率达到96允许译码错误概率105则可以算出自信息方差为98580需要的信源序列长度为可以看出使用等长编码时为了使编码效率较高96需要对非常长的信源序列进行编码且总存在译码差错
此式表明,只有当 l长的 S s1 , , sq ,有 q 个符号,那么它的N次扩展信 码符号序列数大于或等于N次 源 S N 1 , , N 共有 q N 个符号。 q 扩展信源的符号数时,才可
第五章 信源编码LVRH1010
解:将信源通过一个二元信道传输,就必须把信源符号si变换 成由0,1符号组成的码符号序列,即进行编码。可以用不同 的二元码符号序列与信源符号 一一对应,就得到不同的码。
信源符号 P(si) s1 s2 s3 s4 P(s1) P(s2) P(s3) P(s4) 码1 00 01 10 11 码2 0 01 001 111 5.1 编码的定义 定长码 变长码 二次扩展信源符号 二次扩展码字 S1=S1S1 s2=S1S2 …… s4=S4S4 00 001 …… 111111
l ≥ log r q = 5
分析:考虑到符号出现的概率以及符号之间的相关性后,实际平均每 分析 个英文电报符号所提供的信息量约1.4bit,远小于5bit,因此定长编码 后,每个码字只载1.5bit信息,5个二进制符号最大能载5bit信息 ,因 此,定长编码的信息传输效率低。 解决方案: 解决方案 (1)对于不会出现的符号序列不予编码,这样不会造成误差; (2)对于概率非常小的信源符号序列不予编码,这样可能会造成一 定误差,但当信源符号序列N足够大,误差概率非常小
第五章 信源编码 五
问题
• 对信源有两个重要问题 1. 信源输出的信息量的度量问题 度量问题; 度量问题 2. 如何更有效地 有效地表示信源输出的问题 输出的问题; 有效地 输出的问题
信源输出的符号序列,经过信源编码,变换成 适合信道传输的符号序列,同时,在不失真或允许 一定失真的条件下,用尽可能少的码符号来传递信 源消息,提高信息传输的效率。
i =1 8
a7 0.05
a8 , 0.04
HL (X ) 2 .55 得K = = 2.83bit / 符号 90 % K 即每个符号用 2.83bit 进行定长二元编码,共 有 2 2.83 = 7.11种可能性 若取 L = 1,据 η = 根据 η = H( X ) = 0.9 ⇒ ε = 0 .28 H (X ) + ε
2015秋.信息论.第5章限失真信源编码
r r 1 N 1 d N ( x , y ) d ( xi , yi ) d ( x1 , y1 ) d ( x2 , y2 ) d ( x3 , y3 ) N i 1 3
1 1 d3 000,000 d 0,0 d 0,0 d 0,0 0 0 0 0 3 3 1 1 1 d3 000,001 d 0,0 d 0,0 d 0,1 0 0 1 3 3 3
常见失真函数: 1. 汉明失真: 0, if x y, d ( x, y ) 1, if x y.
2. 平方失真:
2 d ( x, y ) (y x) .
3. 绝对失真: d (x, y ) y x
图像处理中,常用平方误差和绝对误差度量失真
9
若源符号集A包含r个符号,码符号集B包含s个符号,
5.1.2 平均失真
失真函数的数学期望称为平均失真。
D E[d ]
i
p( x y
i i j j
j
)d ( xi , y j )
p ( x ) p ( y
i j
| xi )d ( xi , y j ).
单个符号的 失真函数
信源特性
试验信 道特性
矢量平均失真: DN 1 E[ d N ] N 1 E[d ( xi , yi )] N i 1
13
例7.1.2 假定离散矢量信源N=3,输出矢量序列为X=X1X2X3, 其中Xi的取值为{0,1};经信道传输后的输出为Y=Y1Y2Y3, 其中Yi的取值为{0,1}。定义失真函数
d 0, 0 d 11 , 0 d 0, 1 d 1, 0 1
第5章 有失真信源编码
第5章 有失真信源编码(信息率失真函数)离散信源有失真编码 连续信源有失真编码5.1信息率-失真函数的概念在第2章我们证明了当输入随机变量的概率分布确定时,互信道是条件转移概率的下凸函数,即互信息必存在一个最小值。
然而,在没有其它约束条件的情况下,这个最小值就是零。
因为一方面互信息总是非负的,另一方面,当输入和输出随机变量相互独立时互信息等于零。
所以研究一般情况下互信息的极小值问题没有什么意义。
无失真信源编码时,信源的熵是信息率所能达到的下限。
在很多实际情况下,要做到完全没有失真是没有必要的,特别是对连续信源编码,由于信源的绝对熵无穷大,要达到无失真编码是不可能的。
为此,我们有必要研究在满足某种失真准则下互信息的极小值问题,即信息率-失真函数。
首先看离散信源的情况。
设X和Y是定义在相同取值域},,,{21n a a a B A ==上的离散型随机变量。
失真函数d(x,y) 是定义在B A ⨯上的非负函数B y A x y Y x X d y x d ∈∈===,),,(),(例如,可定义⎩⎨⎧≠===j i j i a a d j i d j i ,,0),(),(α(5.1.1)其物理意义是当输入和输出相等时没有失真,当输入和输出不相等时失真是相同的。
显然失真函数d(x,y)是对Y代表X所引起失真的量度。
失真函数的定义由所研究的客观问题决定。
(5.1.1)式的失真函数称为汉明失真准则。
失真函数只定义了若干具体失真的数值,为了反映随机变量之间的总体失真情况,我们定义平均失真[]),(y x d E d =(5.1.2)对离散型变量∑∑=ijj i d i j p i p ),()|()( (5.1.3)如果X和Y都是L维随机矢量,可定义矢量间的失真为∑==Ll l l L y x d L Y X d 1),(1),((5.1.4)平均失真[]∑∑=====L l Ll ll l L L d L y x d E L Y X d E d 111)],([1),((5.1.5)其中l d 是第l 个分量的平均失真。
第五章 限失真信源编码和率失真函数修改
如果要把连续信源的消息离散化,由于信源熵为无穷大,根据无失真信源编码定理,要用无 穷多个比特数才能完全无失真地描述它,这在实际中是做不到的,因此必然会带来一定程 度的失真 .在允许一定失真程度的条件下,怎样用尽可能少的信道符号来表达信源的信息, 也就是信源熵所能压缩的极限或者说编码后信源输出的信息率压缩的极限值,这就是本章 要讨论的问题———限失真信源编码问题 .限失真信源编码也称保真度准则下的信源编 码、熵压缩编码或者称信息率失真理论,它是量化、数模转换、频带压缩和数据压缩的理 论基础 . 如果无失真的冗余度压缩编码主要是针对离散信源的,那么,有失真的熵压缩编码主 要是针对连续信源 .本章讨论的是离散无记忆信源的限失真信源编码理论,这样便于理解 率失真理论的基本概念 . 我们讨论的物理模型仍然是信源编码器,编码器的输入符号集 X = x1, x2,⋯, xr , ⋯ 输出符号集 Y = y1, y2,⋯, ys .编码器可以看作一个广义的信道, X是信道的输入, Y ⋯ 是信道的输出 .与无失真信源编码不同,这时从输入到输出的映射是一个多对一的映射, 它是不可逆的,信源符号序列和码符号序列之间的差异就是编码时引入的失真 .
≥ Dmax
ˆ x
x
由 Q (D ) 的定义必有 D ≥ Dmax 。
ˆ ˆ 反之,设 D ≥ Dmax 。由定义知,存在 x ∈ χ ,使
*
ˆ Dmax = ∑ p( x)d ( x, x * )
x
定义条件概率
1 x = x * ˆ ( x x) = ˆ ˆ Q ˆ ˆ ˆ 0 x ≠ x*
然而,实际中的信源往往是连续信源,一般来 说,不可能实现完全无失真的传输信源的信息.同 时,在实际生活中人们并不要求完全无失真地恢 复消息,只要求在一定的保真度条件下,近似地恢 复信源发出的消息.这就是本章要讨论的限失真 信源编码问题.
信息论基础 第5章 限失真信源编码和率失真函数
构成一个码本,为对应信源的重构
定义5.1.2 率失真对(R,D)可达,若存在一个(2nR , n)率失真码
序列,满足
lim
n
Ed
(
X
n
,gn
(f
n
(X
n
)))
D
率失真区域:可达(R, D)的闭包
定义5.1.3 率失真函数:给定D时,R(D) min R ( R,D)可达 失真率函数:给定R时,D(R) min D ( R,D)可达
1
...
0
...
1
1
1
...
0
在二元情况下:
D
1 0
0
1
失真度和平均失真度
2:
2
d (xi , y j ) xi y j
3: d(xi , y j ) xi y j
平方误差失真 绝对失真
例1:对称信源n=m,定义失真度为:
2
d (xi , y j ) xi y j
当n=m=3时, X 0 1 2 Y 0 1 2
nm
D P(x, y)d (x, y)
P(xi )P( y j / xi )d (xi , y j )
X ,Y
i1 j 1
信息率失真函数及其性质
选择试验信道满足
p( y j | xi ) 1
j p( y j | xi ) 0
所有d (xi , y j ) 最小值的y j Y i 1, 2,L , m
失真度和平均失真度
长度为n的信源符号序列的失真度
定义:符号序列X N X1, X 2 ,L , X N ,其中每个随机变量Xi
取值于同一符号集 x1, x2 ,L , xn , X N共有nN个不同符号i, 而接收端的符号序列为Y N Y1,Y2,L ,YN ,Yj y1, y2,L , ym ,
第五章 离散信源的限失真信源编码
i
) P ( y j | x i )d ij
若X和Y都是n维矢量消息的集合,也可以定义两个矢量消息之 间的失真函数为:
d n ( x, y) 1 n
d( x
r 1
n
r
, yr )
其平均失真函数为:
d n ( x , y ) E [d n ( x , y )] 1 n
r
1 n
r 1
j
值中的最小值,故定义Dmax为:
Dmax min d j min
Y Y
P( x
X
i
)d ij
例:已知信源的消息集合X中包含x0和x1两个消息,并设它们的概 率为P(X1)=p < 1/2,P(X2)=1-p,而信宿符号集合Y也包含两个 符号y0和y1 ,失真矩阵为
D d 00 d 10 d 01 d 11 0
X2={a91,…, a100},Y2={a90},属于失真集合,对应dij=1, 其中i=91,92,…,100,j=90 据题意,P(xi)=1/100,i=1,2,…,100 所以,有:
d
X 2Y2
P ( x i ) P ( y j | x i )d ij 1 1 1 0.1
R( D )
{ P ( y j | x i )} PD
min
I ( X ; Y ) min I ( X ; Y )
d D
R(D)又称作率失真函数 信息率失真函数与信道容量的关系: 信源与信道的对偶关系反映在信息率失真函数与信道容量之 间的对偶关系。信道容量C是给定信道传输概率集合(或信道矩 阵)的条件下,信道所允许的最大信息传输速率。也就是说,信 道容量C是在给定传输特性的条件下,平均互信息量I(X;Y)在 信源消息概率矢量上的一个极大值。信息率失真函数R(D)是在 给定信源消息概率分布的条件下,I(X;Y)在试验信道的信道 传输概率矢量P(yj|xi)上一个极小值
信息论与编码[第五章无失真信源编码定理与编码]山东大学期末考试知识点复习
第五章无失真信源编码定理与编码5.1.1 信源编码和码的类型1.信源编码2.码的类型若码符号集中符号数r=2称为二元码,r=3称为三元码,……,r元码。
若分组码中所有码字的码长都相同则称为等长码,否则称为变长码。
若分组码中所有码字都不相同则称为非奇异码,否则称为奇异码。
若每个码符号x i∈X的传输时间都相同则称为同价码,否则称为非同价码。
若分组码的任意一串有限长的码符号只能被唯一地译成所对应的信源符号序列则称为唯一可译码,否则称为非唯一可译码。
若分组码中,没有任何完整的码字是其他码字的前缀,则称为即时码(又称非延长码或前缀条件码),否则称为延长码。
本章主要研究的是同价唯一可译码.5.1.2 即时码及其树图构造法即时码(非延长码或前缀条件码)是唯一可译码的一类子码。
即时码可用树图法来构造。
构造的要点是:(1)最上端为树根A,从根出发向下伸出树枝,树枝总数等于r,树枝的尽头为节点。
(2)从每个节点再伸出r枝树枝,当某节点被安排为码字后,就不再伸枝,这节点为终端节点。
一直继续进行,直至都不能伸枝为止。
(3)每个节点所伸出的树枝标上码符号,从根出发到终端节点所走路径对应的码符号序列则为终端节点的码字。
即时码可用树图法来进行编码和译码。
从树图可知,即时码可以即时进行译码。
当码字长度给定,即时码不是唯一的。
可以认为等长唯一可译码是即时码的一类子码。
5.1.3 唯一可译码存在的充要条件(1)对含有q个信源符号的信源用含r个符号的码符号集进行编码,各码字的码长为l1,l2,…,l q的唯一可译码存在的充要条件是,满足Kraft不等式5.1.4 唯一可译码的判断法唯一可译码的判断步骤:首先,观察是否是非奇异码.若是奇异码则一定不是唯一可译码。
其次,计算是否满足Kraft不等式。
若不满足一定不是唯一可译码。
再次,将码画成一棵树图,观察是否满足即时码的树图的构造,若满足则是唯一可译码。
或用Sardinas和Patterson设计的判断方法:计算出分组码中所有可能的尾随后缀集合F,观察F中有没有包含任一码字,若无则为唯一可译码;若有则一定不是唯一可译码.上述判断步骤中Sardinas和Patterson设计的判断方法是能确切地判断出是否是唯一可译码的方法,所以可以跳过前三个步骤直接采用该判断法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0 1 0 .5 D= 1 0 0 .5
第5章 限失真信源编码 章
2.误差失真函数 2.误差失真函数 误差失真函数有两种,一种是: 误差失真函数有两种,一种是:
d ( x i , y j ) =| xi − y j |
称为绝对值误差失真函数。之所以取绝对值,是为了保证失真函数为非负。 称为绝对值误差失真函数。 之所以取绝对值,是为了保证失真函数为非负。负的失 真函数违反数据处理定理,不可以使用。由于绝对值处理麻烦,因而应用很少。 真函数违反数据处理定理, 不可以使用。由于绝对值处理麻烦 ,因而应用很少。 另一种是: 另一种是:
5.1失真测度 5.1失真测度
第5章 限失真信源编码 章
5.1.1 失真函数
设离散信源 X 为:
X x1 P( X ) = p( x ) 1
x2 L xm p( x 2 ) L p( x m )
经过信道传输后接收端的离散变量 Y 的概率空间为: 的概率空间为:
(5-2)
在离散对称信道(m=n)中, 定义单个符号的 失真度为汉明失真,它表示当再现的接 收符号 中 定义单个符号的失真度为汉明失真,它表示当再现的接收 在离散对称信道 与发送的信源符号相同时,就不存在失真的错误,所以失真度 d ( xi , y j ) = 0 。 当再现的接收符 与发送的信源符号相同时, 就不存在失真的 错误, 当再现的接收 号与发送符号不同时,就有失真存在 ,而且认为发送符号与再现符号不同时所引起的失真都相 号与发送符号不同时 ,就有失真存在,而且认为发送符号与再现符号不同时所引起的失真都相 为常数, 同 ,所以失真度 d ( xi , y j ), xi = y j 为常数,通常取值为 1,这种失真称为汉明失真 。 ,这种失真称为汉明失真。
第5章 限失真信源编码 章
这时, D 就是允许失真的上界,是由设计要求决定的,式( 5-4)就称为保真度 这时, 就是允许失真的上界,是由设计要求决定的, ) 准则,人为地定义出一个对系统平均失真度的技术要求。 准则,人为地定义出一个对系统平均失真度的技术要求。 值的所有信道( 显然, 显然 , 式 (5-3) 中 , 凡是 D 值小于等于 D 值的所有信道 ( 用信道统计特性 p ( y j | x i ) 表示) 都是满足平均失真度要求的信道, 表示) 都是满足平均失真度要求的信道, ,都是满足平均失真度要求的信道 , 最小,但仍是能满足平均失真度要 其中一个最差的信道就是传信率 R = I (X;Y ) 最小,但仍是能满足平均失真度要 求的信道,而更差的信道必然不能满足平均失真度的要求。可见, 求的信道,而更差的信道必然不能满足平均失真度的要求。可见,把保真度准则作 为约束条件, 的最小值,就是一个不为零的有实际意义的值了。 为约束条件,再求信道传信率 R 的最小值,就是一个不为零的有实际意义的值了。 要找出一个最差但仍能满足平均失真度要求的信道,是为了用最低的代价满足通信 要找出一个最差但仍能满足平均失真度要求的信道, 的失真要求。 的失真要求。
第5章 限失真信源编码 章
d ( x1 , y1 ) d ( x 2 , y 2 ) L d ( x1 , y n ) d (x , y ) d (x , y ) L d (x , y ) 2 1 2 2 2 n D= M M M d ( x m , y1 ) d ( x m , y 2 ) L d ( x m , y n )
PD = p ( y j | x i ); D ≤ D ; i = 1 , 2 , L , m ; j = 1 , 2 , L,n
{
}
PD 中一般有许多符合条件的信道,从经济、高效的角度考虑,在满足允许失真度 D 的情 中一般有许多符合条件的信道,从经济、高效的角度考虑
况下,传递信源所需的传信率越小越好。而对于信宿端,在满足保真度准则的条件下,要确 况下,传递信源所需的传信率越小越好。而对于信宿端,在满足保真度准则的条件下, 定所需的最小平均信息量,即求平均互信息量的最小值, 中的“最差” 定所需的最小平均信息量, 即求平均互信息量的最小值,由此可找出存在于 PD 中的 “最差” 的信道。 的信道。 这样在满足保真度准则的所有 D 失真许可的试验信道集合 PD 中寻找某一个信道 P ( y j | x i ) , 达到最小, 使 I ( X ; Y ) 达到最小,即:
d ( xi , y j ) =(xi − y j)
2
称为平方误差失真函数。也有一个对应的失真矩阵,矩阵中的非零元素表示发送 x i , 称为平方误差失真函数。也有一个对应的失真矩阵, 所引起的失真 取平方主要也是为了保证失真函数为负数。 起的失真。 接收 y j 所引起的失真。 取平方主要也是为了保证失真函数为负数 。
Y y1 P (Y ) = p ( y ) 1
L yn p ( y 2 ) L p( y n ) y2
对于每一对 ( xi , y j ) ,指定一个非负的函数 d ( x i , y j ) ≥ 0, i = 1 , 2 , L , m ; j = 1 , 2 , L , n , 为单位符号的失真度或失真函数, 称 d ( xi , y j ) 为单位符号的失真度或失真函数, 用它来表示信源发出一个符号 x i , 而在接收端再 所引起的误差或失真的大小。 值代表较小的失真, 现为 y j 所引起的误差或失真的大小。通常较小的 d 值代表较小的失真,而 d ( xi , y j ) = 0 表示没 有失真。 个符号, 个符号, 有失真。由于信源 X 有 m 个符号 ,信道传输 Y 有 n 个符号,所以 d ( x i , y j ) 有 m × n 个, 这 m × n 个非负的函数可以排列成矩阵形式, 个非负的函数可以排列成矩阵形式, 即:
5.2 信息率失真函数
第5章 限失真信源编码 章
5.2.1 信息率失真函数的一般概念
如果信源和失真度给定,则根据式( ) 如果信源和失真度定,则根据式( 5-3) D 就只与信道特性有关,把所有满足保真度 , 就只与信道特性有关, 的信道集中起来, 失真允许的试验信道集合, 准则 D ≤ D 的信道集中起来,构成一个所谓 D 失真允许的试验信道集合,记为 PD , 即:
D = E[ d ( x i , y j )]
=
∑∑ p( x y
i i =1 j =1
m n i
m
n
j )d ( x i
yj)
=
的联合概率空间求平均。 它是在 X,Y 的联合概率空间求平均。
∑∑ p( x ) p( y
i =1 j =1
j
| xi )d ( xi y j )
(5-3)
为了系统能满足使用要求, 为了系统能满足使用要求, 技术上往往要求平均失真度 D 不大于某个额定值 D ,即: D≤D (5-4)
对于给定的信源, 的前提下, 对于给定的信源,在满足保真度准则 D ≤ D 的前提下,信息率失真函数 R(D) 是信 源输出的允许达到的最小值, 的下凸函数, 集合中, 源输出的允许达到的最小值 ,由于 I ( X ; Y ) 是 P ( y j | x i ) 的下凸函数,所以在 PD 集合中, 的最小值一定存在。 I ( X ; Y ) 的最小值一定存在。 由以上分析可知: 由以上分析可知:信息率失真函数 R(D) 是在信源概率分布 p ( x i ) 和允许失真 D 给定 的条件下求平均互信息的极小值的问题, 的条件下求平均互信息的极小值的问题,而前面讲的信道容量 C 是在 P ( y j | xi ) 给定的条 件下求平均互信息的极大值的问题。 件下求平均互信息的极大值的问题。 是指在信道固定的前提下, 信道容量 C = max I ( X , Y ) 是指在信道固定的前提下, 选择一种信源概率分布使信息
第5章 限失真信源编码 章
5.1.2 平均失真度
都是随机变量, 也是随机变量,显然, 由于 X,Y 都是随机变量 ,故单个符号失真度 d ( xi , y j ) 也是随机变量,显然 ,规定了 之后,传输一个符号引起的平均失真,即信源的平均失真度为: 单个符号失真度 d ( xi , y j ) 之后,传输一个符号引起的平均失真 ,即信源的平均失真度为:
(5-1)
称为失真矩阵, 阶矩阵。 D 称为失真矩阵,它是一个 m × n 阶矩阵。 失真函数是根据人们的实际需要和失真引起的损失、风险大小等人为规定的。 失真函数是根据人们的实际需要和失真引起的损失、 风险大小等人为规定的。常用的失 真函数有: 真函数有: 1.汉明失真函数 1.汉明失真函数
0 xi = y j d ( xi , y j ) = 1 xi ≠ y j
RD =
p ( y j | xi )∈BD
min
I ( X ;Y )
(5-5)
就是信息率失真函数,简称为率失真函数, 信源符号、 这个最小值 R(D) 就是信息率失真函数,简称为率失真函数,它的单位是比特 /信源符号 、 信源符号。 哈特莱 /信源符号或奈特 /信源符号。
第5章 限失真信源编码 章
第5章 限失真信源编码 章
通常为方阵, 汉明失真矩阵 D 通常为方阵, 且对角线上的元素为 0。即 : 。
0 1 D= M 1
阶方阵。 D 是 m × m 阶方阵。 例 题:
1 1 L 1 0 1 L 1 M M M 1 1 L 0
设信道输入 X = {0 , 1} , 输出 Y = {0 , 1 , 2} , 规定失真函数 d (0 , 0) = d (1 , 1) = 0 , d (0 , 1) = d (1 , 0) = 1 , d (0 , 2) = d (2 , 0) = 0.5 ,求 D 。 由失真函数和失真矩阵可得出: 解 :由失真函数和失真矩阵可得出:
信息论与编码
第5章 限失真信源编码
北京大学出版社
2012-4-21