第四章 无失真信源编码

合集下载

信息论与编码第4章无失真信源编码

信息论与编码第4章无失真信源编码

0
2
1
w1 0 1 2 0 1 2
01
2w2
w3 w4
0
1
2
w5
w6 w7 w8
w9 w10 w11
0级节点 1级节点 2级节点
3级节点
25
4.3 变长编码
码树编码方法
(1)树根编码的起点; (2)每一个中间节点树枝的个数编码的进制数; (3)树的节点编码或编码的一部分; (4)树的终止节点(端点、树叶)码; (5)树的节数码长; (6)码位于多级节点变长码; (7)码位于同一级节点码等长码;
设离散无记忆信源X的熵为H(X), 若对长为N的信源符号序 列进行等长编码,码长为L , 码元符号个数为m. 则对任意的
>0, >0, 只要
L log m H ( 率小于。
反之,当
L log m H ( X ) 2
N
时, 则译码差错概率一定是有限值(不可能实现无失真编 码), 而当N足够大时, 译码错误概率近似等于1。
概率分布 0.5 0.25 0.125 0.125
码1:C1 码2:C2 码3:C3
00
0
0
码4:C4 1
码5:C5 1
01
11
10
10
01
10
00
00
100
001
11
11
01
1000
0001
等长码 非唯一 非 唯 唯一可译 及时码 可译 一可译
11
4.1 无失真信源编码的概念
关系 即时码一定是唯一可译码 唯一可译码一定是非奇异码 定长的非奇异码一定是唯一可译码 非定长的非奇异码不一定是唯一可译码
一般地,平均码长: L 3.322 (N ) N

信息论.第4章无失真信源编码

信息论.第4章无失真信源编码

S N
1
P
p(1 )
2 ... p(2 ) ...
qN
p(qN )
扩展信源熵为H(SN),
5
用码符号集X=(x1,…,xr)对SN 编码,则总可以找到
一种编码方法,构成唯一可译码,使信源S中的一
个信源符号所需要的码字平均长度满足
H (S) 1 LN H (S) log r N N log r
N log r 则当N足够大时,译码错误概率趋于1。
3
信源编码效率 编码速率:对于定长编码,编码速率定义为
R L log r N
编码效率:
H(S)
R
4
变长无失真信源编码定理(香农第一定理)
设离散无记忆信源
S
P
s1 p( s1 )
s2 p(s2 )
... ...
sq
p(
sq
)
其信源熵为H(S),它的N次扩展信源SN为
l log q log r
2
定长信源编码定理
设有离散无记忆信源,熵为H(S) ,若对信源的长为N 的符号序列进行定长编码,设码字是从r个码符号集中选 取L个码元构成,对于 > 0 只要满足
L H(S)
N log r 则当N足够大时,可实现译码错误概率任意小的等长编
码,近似无失真编码。
反之,若 满足 L H (s) 2
i 1
克拉夫特证明不等式为即时码存在的充要条件; 麦克米伦证明不等式为唯一可译码存在的充要条件。
1
简单信源S存在唯一可译定长码的条件为:
q r l l log q
log r
N次扩展信源SN存在唯一可译定长码的条件为:
qN rL
L log r N log q来自L log q N log r

《 无失真信源编码》课件

《 无失真信源编码》课件

为什么需要无失真信源编码?
无失真信源编码在数字通信、音频和视频处理领域扮演着重要角色。它可以 节省存储空间,提高信号传输速率,并保证信息的完整性。
带源编码和无失真信源编码的对比
带源编码会对原始信号进行压缩,但会导致信息丢失和质量下降。无失真信源编码通过使用更复杂的算 法来保持信息的完整性和质量。
常见的无失真信源编码方法
PCM编码
基于脉冲编码调制,是最 常用的无失真音频编码方 法之一。
DPCM编码
差分脉冲编码调制,通过 预测和编码差异来实现无 失真音频压缩。
ADPCM编码
自适应差分脉冲编码调制, 根据信号特征动态地调整 编码参数以提高压缩效率。
区分编码和解码过程
编码过程将原始信源数据转换为压缩表示形式,而解码过程将压缩表示形式 还原为原始数据。
WavPack
一种无损音频编码格式,延 伸了FLAC的功能并具有更高 的压缩比。
对比不同无失真编码方法的性 能
不同的无失真编码方法在压缩比、音频质量和解码复杂性方面表现不同。综 合考虑这些因素才能选择最适合的编码方法。
无失真编码技术的应用领域
无失真编码技术广泛应用于音频和视频处理、通信系统、数据存储和传输领域。它可以提高效率、降低 成本,并保证信息的完整性。
无失真编码的未来发展趋势
随着技术的不断发展,无失真编码方法将更加高效和智能化,能够适应更多领域和应用需求。
国内外的无失真编码标准和应 用情况
世界各地的研究机构和标准化组织都在推动无失真编码标准的发展和应用。 国内也有一些具有自主知识产权的无失真编码方法。
结束语和展望
无失真信源编码是信息处理领域的重要技术,它将继续发展并在更多领域得 到应用。希望本课件能帮助您进一步了解无失真信源编码的原理和应用。

可变长无失真信源编码定理

可变长无失真信源编码定理

可变长无失真信源编码定理一、概述可变长无失真信源编码定理是信息论的核心概念之一,它是由美国数学家香农(Claude Shannon)于1948年首次提出。

该定理主要探讨了信源编码的极限性能,为无失真编码提供了理论基础。

可变长无失真信源编码定理不仅在理论上有重要意义,而且在数据压缩、网络传输和存储系统等领域有着广泛的应用价值。

二、定理内容可变长无失真信源编码定理的主要内容是:对于任意给定的离散无记忆信源,存在一种可变长编码方式,使得编码后的平均码长小于或等于信源的熵,从而实现无失真编码。

换句话说,如果信源的熵为H,那么存在一种编码方式,使得编码后的平均码长L满足L ≤ H。

三、证明过程证明可变长无失真信源编码定理的过程较为复杂,涉及到概率论和信息论的基本知识。

以下是证明过程的大致步骤:1.定义信源的熵:信源的熵是信源输出随机变量的不确定性度量,定义为所有可能符号的概率加权和。

如果信源有n个符号,每个符号出现的概率为p1, p2, ..., pn,则信源的熵H定义为H = - Σ (pi * log2(pi)),其中i=1,2,...,n。

2.构造一个可变长度编码表:根据信源的概率分布,构造一个可变长度编码表,使得出现概率较大的符号对应较短的码字,反之亦然。

假设码字长度按照字典序排列,第i个码字的长度为log2(1/pi),其中i=1,2,...,n。

3.计算平均码长:根据可变长度编码表,计算所有可能符号的平均码长。

平均码长等于所有码字长度的概率加权和,即L = Σ(log2(1/pi) * pi),其中i=1,2,...,n。

4.证明平均码长小于或等于信源熵:利用不等式性质和概率分布的性质,推导出平均码长L满足L ≤H。

关键在于利用概率分布的不均匀性,通过调整码字长度来最小化平均码长。

5.构造一个解码函数:为了实现无失真解码,需要构造一个解码函数,使得每个码字能够唯一地还原为原始符号。

解码函数可以采用查表法或类似算法实现。

第4章 信源无失真编码

第4章 信源无失真编码

5种不同的码
U u1 u2 u3 u4
P (ui )
1 1 1 1 2 4 8 8
W1 00 01 10 11
W2 00 00 10 11
W3 1 00 01 10
W4 0 10 110 111
W5 0 01 1,00,10,01 u1u 2 u 4 u 3 011 1001001 10,01,00,1 u 4 u 3u 2 u1 1,00,1,00,1 u u u u u 1 2 1 2 1 111
W1:定长码。 非奇异码。 定长非奇异码肯定是UDC。 W2:定长码。 奇异码。 奇异码肯定不是UDC。
W3:变长码。 非奇异码。 续长码。 非即时码。 不是UDC。 即时码。 W4:变长码。 非奇异码。 非续长码。 非续长码肯定是UDC。 W5:变长码。 非奇异码。 续长码。 非即时码。 是UDC。
i 1
q
平均码长是衡量码的 性能的重要参数,“平均 码长小”说明平均一个码 元所携带的信息量大,信 息的冗余就小。
例:编码
设DMS的概率空间为
U u1 u2 u3 u4 P 1 2 1 4 1 8 1 8 U
信 源
U
{u1 ,u2 ,u3 ,u4 }
编码器 f
U
信源 编码
W
信源 译码
ˆ U
信 宿
f
f 1
• f为一一对应的变换只是无失真编码的必要条件,并不充分; • 要保证将码元序列无失真地恢复成信源符号序列,还要求编
出的码自身具有独特的结构。
• 有实用价值的码应该具有唯一可译性,即能从码字序列(也 是码元序列)唯一地恢复成信源符号序列。
1、唯一可译码(UDC,Uniquely Decodable Code) • 唯一可译码(UDC):该码的码字组成的任意有限长码字序 列都能恢复成唯一的信源序列。否则称为非唯一可译码。 • 码是唯一可译码的充分必要条件是:由码中的码字组成的 任意有限长的码字序列(也是码元序列),都能唯一划分 成一个个的码字,且任一码字只与唯一一个信源符号对应。 • 奇异码:含相同码字的码。否则称为非奇异码。 • 非续长码:码中任一码字都不是另一码字的续长(延长)。 否则为续长码。 • 非即时码:如果接收端收到一个完整的码字后,不能立即 译码,还需等下一个码字开始接收后才能判断是否可以译 码。否则为即时码。

2015秋.信息论.第4节无失真信源编码

2015秋.信息论.第4节无失真信源编码

00001 001 0000001 0000000 01 0000000 0001 000001 0001 0000001 5 3 7 7 2 7 4 6 4 71 01 001 0001 00001 000001 0000001 0000000S1 s2 s3 s4 s5 s6 s7 s8000 001 010 011 100 101 110 111第四章无失真信源编码将信源产生的全部信息无损地发送给信宿,这种信源编码称无失真信源编码。

编码过程由编码器实现。

§4.1 编码器r编码器数学模型1、编码器构成:输入:信源符号集S =(s 1,s 2, …s q ),由q 个符号组成码符号集X =(x 1,x 2…x r ),由r 个符号组成输出:代码组C =(w 1, w 2,…w q ),由q 个码字组成其中,称为码字,l i 称为码字长度)...(21il i i i i x x x w =2、编码器的作用:将信源符号集S 中的符号s i ,i=1,2…,q→ 变换成由码符号集X 中的码元x j ,j=1,2…,r 组成的长度为l i 的一一对应的码字码字的集合称为代码组C 。

)...(21i l i i i i x x x w =3、码分类:根据代码组C 中码字的长度固定长度码:(定长码)代码组C 中所有码字的长度相同。

可变长度码:(变长码)代码组C 中码字的长度不相同。

10晴阴雨雪0.40.30.20.11*0.4+2*0.3+3*0.2+3*0.1=1.94、码奇异性:非奇异码:代码组C中所有码字都不相同。

奇异码:代码组C中有相同的码字。

§4.2 即时码与唯一可译码1、分组码定义:信源符号集S中的每一个符号si 都映射成一个固定的码字wi,这种码称为分组码。

2、分组码性质:(1) 奇异性:•非奇异性是分组码正确译码的必要条件。

(2) 唯一可译性:•如果一个分组码对于任意有限的整数N,其N次扩展码均为非奇异码,则称之为唯一可译码。

第4章无失真信源编码

第4章无失真信源编码

是信源编码
码的分类-I
(1) 定长码:码中所有码字的长度都相同, 变长 码:码中的码字长短不一
信源 信源符号出
码表
符号ai 现概率p(ai) 码1 码2
a1
p(a1)
00 0
a2
p(a2)
01 01
a3
p(a3)
10 001
a4
p(a4)
11 111
表4-1 变长码与定长码
码的分类-II
(2)非奇异码:若信源符号和码字一一对应的 奇异码:反之。下表码1是奇异码,码2是非奇异码。
将这两个概率相加作为一个新字母的概率,与未分 配的二进符号的字母重新排队。 3. 对重排后的两个概率最小符号重复(2)的过程。 4. 重复上述过程,直到最后两个符号配以0和1为止。 5. 从最后一级开始,向前返回得到各个信源符号所对 应的码元序列,即相应的码字。
例 对以下信源进行哈夫曼编码
信源符号ai 概率p(ai) 码字Wi
H(S) L H(S) 1
log r
log r
离散平稳无记忆序列变长编码定理:对于平均符号 熵为H(S)的离散平稳无记忆信源,必存在一种无失真 编码方法,使平均信息率满足不等式
H (S) LN H (S) 1 log r N log r N
将定理进行改写:
H (S )
LN N
log r
H(S)
通常可用码树来表示各码字的构成
0
1
0
1
0
1
01
01
01
01
0 1 0 10 10 1 0 10 10 1 0 1
二进制码树(满树)
即时码的码树表示(2)
0
1

第四章 常用无失真信源编码方法

第四章 常用无失真信源编码方法
100%
$4.2 费诺编码
§4.2 费诺编码
* (1) 将信源符号按概率从大到小依次排列。设排序后的
编码步骤如下: 消息分别记为x1, x2, …, xn。 (2) 将信源符号按概率分成若干组,使每组的概率的 和尽量接近或相等。若编二元码就分两组,编m 元码 就分成m 组。 (3) 给每组分配一位码元,码元的分配是任意的。
0 log p( x j ) 1 1 log p( x j ) 2 2 log p( x j ) 3 3 log p( x j ) 4 4 log p( x j ) 5
kj 1 kj 2 kj 3 kj 4 kj 5
$4.1 香农编码
' ' ' ' ' ' x1 , x2 , x3 , x4 , x5 , x6 例4.1.1 对信源 0.2, 0.15, 0.1, 0.25, 0.25, 0.05 编香农码。
解: (1) 按概率从大到小依次排列
x2 , x3 , x4 , x5 , x6 x1 , 0.25, 0.25, 0.2, 0.15, 0.1, 0.05
计算编码效率
要求平均每个信源 符号传递的信息量 折算后,平均每个信源
符号的最大可能载信量
H (X ) L log m N
x1 , X 1 P , 码字 2 0
x2 ,
x5 , 1 1 1 1 , , , , 4 8 16 16 10 110 1110 1111 x3 , x4 ,
(5) 计算编码效率
log log log log H (X ) 1 1 1 1 log 2 L log m ( 1 2 3 2 4) 2 4 8 16 1 N

信息论与编码理论-第4章无失真信源编码-习题解答-20071202

信息论与编码理论-第4章无失真信源编码-习题解答-20071202

第4章无失真信源编码习题及其参考答案4-1 有一信源,它有六个可能的输出,其概率分布如下表所示,表中给出了对应的码A、B、C、D、E和F(1)求这些码中哪些是唯一可译码;(2)求哪些码是及时码;(3)对所有唯一可译码求出其平均码长l。

4-2 设信源61261126()1()()()()iis s sXp sp s p s p sP X=⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦∑。

对此次能源进行m元唯一可译编码,其对应的码长为(l1,l2,…,l6)=(1,1,2,3,2,3),求m值的最好下限。

(提示:用kraft不等式)4-3设信源为1234567811111111()248163264128128s s s s s s s sXp X⎡⎤⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦,编成这样的码:(000,001,010,011,100,101,110,111)。

求(1)信源的符号熵;(2)这种码的编码效率;(3)相应的仙农码和费诺码。

4-4求概率分布为11122(,,,,)3551515信源的二元霍夫曼编码。

讨论此码对于概率分布为11111(,,,,)55555的信源也是最佳二元码。

4-5有两个信源X和Y如下:121234567()0.200.190.180.170.150.100.01X s s s s s s s p X ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦123456789()0.490.140.140.070.070.040.020.020.01Y s s s s s s s s s p Y ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦(1)用二元霍夫曼编码、仙农编码以及费诺编码对信源X 和Y 进行编码,并计算其平均码长和编码效率;(2)从X ,Y 两种不同信源来比较三种编码方法的优缺点。

4-6设二元霍夫曼码为(00,01,10,11)和(0,10,110,111),求出可以编得这样 霍夫曼码的信源的所有概率分布。

4-7设信源为12345678()0.40.20.10.10.050.050.050.05X s s s s s s s s p X ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦,求其三元霍夫曼编码。

信息论无失真信源编码

信息论无失真信源编码
含义:无论码由多少个码字组成,总是能 够正确译码,不存在二义性。
即时码
ABCD 1 10 100 1000
ABCD 1 01 001 0001
10110 010 →BACB
10110 0 01→ABAD
无需知道下一个码字的码符号,即可译码, 这样的唯一可译码成为即时码。
命题5.2.1 一个唯一可译码成为即时码的充 要条件是其中任何一个码字都不是其他码 字的前缀。
信源 信源编码器 纠错编码器 调制器
干扰源
信 道
信宿 信源译码器 纠错译码器 解调器
无失真信源编码:解码之后可以得到原始 信息,例如霍夫曼编码。它相对简单,是 本章的重点。
有失真信源编码:解码之后的信息与原始 信息有一定的差别,例如JPEG、MPEG
5.1 编码器
S=(s1,s2,…,sq) 编码器 C=编码,编码器的映射必须是一一对 应、可逆的。
码的分类
根据码长
固定长度码(定长码):所有码字的长度相同。 可变长度码(变长码):码字长短不一。
码字是否相同
非奇异码:所有码字都不相同。 奇异码:存在相同的码字。
5.2 分组码
s1,…,si-1 si si+1,…,sq
无关
无关
5.3 定长码
编码速率:R
l
log N
r
,其中l是码字长度,r是码符号的个
数,N代表N次扩展信源。
编码效率:η=H(S)/R,其中H(S)是扩展之前信源的熵。
例如:S={A,B,C}, 等概率出现,N=2, SN={AA,…,CC},对 SN进行二元编码,则r=2,编码方式如下,则l=4。
AA AB AC BA BB BC CA CB CC

本_信息论与编码A_第4章无失真信源编码

本_信息论与编码A_第4章无失真信源编码

13
4.2 等长编码
无失真编码 假设信道无干扰 译码错误概率: Pe=P{MM’} 无失真编码: 译码错误概率Pe可以任意小.
M W W M’
信源
信源编码
信 道
信源解码
信宿
14
4.2 等长编码
等长信源编码定理 定理4-1(Shannon信源编码定理) 设离散无记忆信源X的熵为H(X), 若对长为N的信源符号序 列进行等长编码,码长为L , 码元符号个数为m. 则对任意的 >0, >0, 只要
s4 备注
平均码长
0.125
11 2
2
11 非唯一可译
1.5
01
1000
0001 及时码
1.875
非唯一可译 唯一可译
1.5 1.875
24
4.3
变长编码
码树编码方法 三元树码:C={w1, w2,…,w11} w1=0, w2=11, w3=12, w4=20, w5=22, w6=100, w7=101, w8=102, w9=210, w10=211, w11=212. 树码一定是即时码

H(X ) R R H(X )


2.55 2.83 0.90
即每个符号用2.83bit进行定长二元编码,最多有7.11 (= 22.83)个码字。但信源符号共有8个,其中一个无码字, 取概率最小的s8不编码, 则译码错误概率为0.04.太大!
18
4.2 等长编码
例4-3(续)
H(X ) =0.90 0.28 H(X )
0级节点
0 1 1 2 2
1级节点
2 0 1 2
w1
0

信息论与编码第4章无失真信源编码

信息论与编码第4章无失真信源编码

THANKS
感谢观看
编码性能的评价指标
压缩比
压缩比是指编码后数据量与原始数据量之比,是衡量 编码效率的重要指标。
编码复杂度
编码复杂度是指实现编码算法所需的计算量和存储量 ,是衡量编码性能的重要指标。
重建精度
重建精度是指解码后数据的准确度,是衡量编码性能 的重要指标。
编码效率与性能的关系
01
编码效率与压缩比成正比,压缩比越高,编码效率越高。
游程编码
对连续出现的相同符号进 行编码,如哈夫曼编码等 。
算术编码
将输入信号映射到一个实 数轴上的区间,通过该区 间的起始和长度表示码字 ,如格雷码等。
编码的数学模型
信源
产生随机变量的集合 ,表示各种可能的信 息符号。
编码器
将输入信号映射到码 字的转换设备,其输 出为码字序列。
解码器
将接收到的码字还原 成原始信号的设备。
拓展应用领域
无失真信源编码技术的应用领域正在不断拓 展,未来研究将致力于将其应用于更多领域 ,如多媒体处理、物联网、云计算等。
融合其他技术
将无失真信源编码技术与其他相关技术进行 融合,以实现更高效、更实用的信息处理系 统。例如,将无失真信源编码与图像处理、 语音处理等技术相结合,提高信息传输和处
理的效率和质量。
03
行程编码的缺点包 括
压缩比有限、对于离散无记忆信 源效果不佳。
03
CATALOGUE
无失真信源编码的效率与性能
编码效率的定义与计算
定义
编码效率是指编码后信息量与原始信 息量之比,通常用比特率(bit per symbol)或比特率(bit per source symbol)来表示。
计算

第四章无失真信源编码

第四章无失真信源编码
一般来说H:(S当) L有限时,高传输效率的等长码往往要 2
而:引入H(S一) 定i的1 p失i lo真g pi和 0错.81误1(b,it/信它源不符能号)象变长编码那样可以
则:实现0.8真11正的0.无811失真0.9编6码 0.96 0.034
且:
2
2
pi(log
p2 i)
[H(S)]2
P(
A
)
1
2 L
2 表示S中每个符号携带的信息量的方差
本次您浏览到是第十四页,共一百一十四页。
2E 2{I(si)E [I(si)]}
E { I 2 ( s i) 2 I ( s i) • E [ I ( s i) ] E 2 [ I ( s i) ] } E[I2(si)]E2[I(si)]
第四章无失真信源编 码
本次您浏览到是第一页,共一百一十四页。
无失真信源编码
• 无失真编码概述 • 定长信源编码 • 变长信源编码 • 实用的无失真信源编码方法举例
本次您浏览到是第二页,共一百一十四页。
§4.1无失真编码概述-1
离散、无失真、无记忆信源编码的一般模型:
S (S1SL)

信源 编码
§4.3变长信源编码-1
• 几个码类的概念 – 非奇异码(单义码) – 唯一可译码 – 前缀码(即时码、非延长码、异前置码)
– 最佳码(紧致码)
• Kraft定理---即时码码长必须满足的条件
• 唯一可译码存在定理
• 变长编码定理(香农第一定理)
本次您浏览到是第二十四页,共一百一十四页。
§4.3变长信源编码-2(几个码类的概念)
方法: 进行联合编码,即对字母序列编码,且只对哪些有意义的字母序列

第四章 离散信源的无失真编码

第四章 离散信源的无失真编码
母集 a1 a2 a3 a4
Wuhan University
码B 0 1 00 11
码C 0 10 110 111
码D 0 01 011 0111
0.5 0.25 0.125 0.125
0 0 1 10
唯一可译:C, D 逗点码:D 异字头码:C
7
离散无记忆信源的不等长编码
D元码
构造方法一:Shannon-Fano编码法
a 'K 1 p 'K 1
其中, ak’= ak , Pk’= Pk , 当k<K-1 aK-1’= aK-1 ∪ aK , PK-1’= PK-1+ PK
Huffman编码的最佳性
Wuhan University
定理3.4.2 对辅助集U ’为最佳的码,对 原始消息集U也是最佳的。 若C’1,C’2,…,C’K-1是对辅助集U ' 的最佳码,相应码长为n’1,n’2,…, n’K-1,则对U的码字C1,C2,…, CK的 码长为 nk= n’k k≤K–2 nk= n’K-1+1 k=K, K–1
ceada 共40个字母 频度 –a - 16,b - 7,c - 6,d - 6,e - 5 1) 将给定符号按照其频率从大到小排序。 –a - 16,b - 7,c - 6,d - 6,e - 5 2) 将序列分成左右两部分,使得左部频 率总和尽可能接近右部频率总和。有: –(a, b), (c, d, e)
3
离散无记忆信源的不等长编码

Wuhan University
不等长编码的特殊问题 ②平均码字长度。设信源随机变量U的概 率分布为{ak, p(ak), k=1~K},事件ak对 应的码字长度为nk,则平均码字长度为

信息论基础第四章 离散信源的无失真编码

信息论基础第四章 离散信源的无失真编码

信源编码有关概念 (1)平均码长
L p(a i )l i
i 1
q
单位:码符号/信源符号 意义:每个源符号平均需要的码符号数。 编码后每个信源符号平均用 L个码符号表示。 (2)信息传输率(平均每个码符号携带的信息量)
R
H(X ) L
16
L 越短,信息传输率就越高。
(3)最佳码(紧致码) 最佳码:对于某一信源和某一码符号集,若有一唯一可 译码,其平均码长小于所有其他唯一可译码的 平均码长,则该码称为最佳码。(最短唯一可 译码) 无失真信源编码的基本问题就是找到最佳码,最 佳码的平均码长为理论极限。
i 1 i 1
证明:
q


i 1
q
r li p i log pi

i 1
q
r li pi ( 1) pi
r
i 1
q
li
pi 1 1 0
i 1
q
H(S) H ( S ) L log r 0 L log r
18i l i log r
等长非奇异码一定是唯一可译码 ak a1 a2 a3 a4 p(ak) 0.5 0.25 0.125 0.125 码A 00 01 10 11 码B 00 01 00 10
5
等长编码及其定理
对信源S的N次扩展信源SN进行等长编码 若S = { s1, s2,…, sq},则N次扩展信源S N= { a1, a2,…, aqN}, 共有qN个符号序列。 设码符号集为X = { x1, x2,…, xr},长度为l 的码符号序列Wi = (xi1 xi2 … xil), xi1, xi2,…, xil∈X。
异前缀码等价于即时码

2015秋.信息论.第4章无失真信源编码

2015秋.信息论.第4章无失真信源编码

00001 001 0000001 0000000 01 0000000 0001 000001 0001 0000001 5 3 7 7 2 7 4 6 4 71 01 001 0001 00001 000001 0000001 0000000S1 s2 s3 s4 s5 s6 s7 s8000 001 010 011 100 101 110 111第四章无失真信源编码将信源产生的全部信息无损地发送给信宿,这种信源编码称无失真信源编码。

编码过程由编码器实现。

§4.1 编码器r编码器数学模型1、编码器构成:输入:信源符号集S =(s 1,s 2, …s q ),由q 个符号组成码符号集X =(x 1,x 2…x r ),由r 个符号组成输出:代码组C =(w 1, w 2,…w q ),由q 个码字组成其中,称为码字,l i 称为码字长度)...(21i l i i i i x x x w =2、编码器的作用:将信源符号集S 中的符号s i ,i=1,2…,q→ 变换成由码符号集X 中的码元x j ,j=1,2…,r组成的长度为l i 的一一对应的码字码字的集合称为代码组C 。

)...(21i l i i i i x x x w =3、码分类:根据代码组C 中码字的长度固定长度码:(定长码)代码组C 中所有码字的长度相同。

可变长度码:(变长码)代码组C 中码字的长度不相同。

10晴阴雨雪0.40.30.20.11*0.4+2*0.3+3*0.2+3*0.1=1.94、码奇异性:非奇异码:代码组C中所有码字都不相同。

奇异码:代码组C中有相同的码字。

§4.2 即时码与唯一可译码1、分组码定义:都映射成一个固定的码信源符号集S中的每一个符号si,这种码称为分组码。

字wi2、分组码性质:(1) 奇异性:•非奇异性是分组码正确译码的必要条件。

(2) 唯一可译性:•如果一个分组码对于任意有限的整数N,其N次扩展码均为非奇异码,则称之为唯一可译码。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


第四章 无失真信源编码
以上为正定理部分的证明。
利用表达式: r
当 N→∞时,由④式得:来自exp( N ) 2 M (S ) 1 2 N


r exp( N ) →0 2 绝大部分在 A 中的序列已 M (S ) 1 无对应的码字,译码一定出错 N 2
在N→∞时,由①式得 P( A ) →1
可以求得H(S)=2.5524比特/符号及方差
2
2 (S) 7.82 2 2 若要求编码效率为90%,即 7.82 7 82 (S) (.S) H (S ) H ( S(S) 7.82 ) 0 .9 可 H ( ) S H.9S ) 可解得 0.28 0( 09 H ( S ) . 可解得 . 0可解得 .28 0 9 .28 ( S ) 0 H H (S ) H (S )
• 显然,平均码长越短,则Rt越大,信息传输效率 就越高,编码中使平均码长为最短的码是人们感 兴趣的。
第四章 无失真信源编码
• 最佳码:
凡是能载荷一定的信息量,且码字的平均 长度最短,可分离的变长码的码字集合称 为最佳码或紧致码。 无失真信源编码的基本问题就是要找最佳 码,变长码的编码定理确定了最佳码的平 均码长可能达到的理论极限。
码字数为rl
则对S进行等长编码,须满足 q ≤ rl
每个信源符号都有对应的码字可选
第四章 无失真信源编码
若S送出一个信源符号所需的信息率为R,则N长符号 所需的信息率为NR 而每个码元的最大信息量为log r,则 l 长码序列的信 息量为 l log r
编码前后信息量应保持不变,即:
NR= l log r
送出一个信源符号所需信息率:R=(l /N )log r
为使传送信息率最小,需找到一种编码方式,使R最 小。编码定理所研究的就是最小的R为何值才能得到 无失真的译码,若小于此信息率是否还能无失真地译 码?
第四章 无失真信源编码
二、等长信源编码定理 无记忆平稳离散信源的熵为H(S),若对信源长为N的 符号序列进行等长编码,码字从 r 个码符号集中选 取 l 个码元组成,对于任意∈>0,只要满足: 或 则当N足够大时,可实现几乎无失真编码.即译码错 误概率能为任意小。反之,若:
无失真信源编码要求译码结果与信源的输出相比
不产生歧义,信源符号或序列与码本中的码字必
须构成一一对应的变换关系,且译码结果也是唯
一的。
由于离散无记忆信源符号等概分布时,信源输出
的信息量最大为H0,而通常信源是非等概分布,
熵为H(S),必存在信息冗余,即:
H (S ) 1H0
第四章 无失真信源编码
第四章 无失真信源编码
C={W1,W2, ‥,Wn},所以信源编码就是将信源符号
S与码字之间按照一定规则进行的一种变换处理:
S
信源编码器
m
C
或者将长为N的信源符号序列Si=S1S2‥SN与码本中
的码字构成某种对应关系。使信源符号的信息载荷
在码字中。
信源译码是信源编码的逆过程,即由C恢复出S。
第四章 无失真信源编码
)
M exp[( H ( S ) ) N ] P( A ) ) M
a N A
N
min P(a
a N A
N
)
M exp[( H ( S ) ) N ]
将 P( A ) 式代入②式,得:
2 (S ) (1 ) exp[N ( H ( S ) )] M exp[N ( H ( S ) )] ③ 2 N
信源编码中,符号与码字可以有多种对应关系,
即可以有多种不同的编码方式。总可以在这些编
码方式中选择一种最有效地编码,使信源被编码
后,减小甚至消除信源的信息冗余,提高通信系
统的有效性。 编码在工程实现中有两种形式:等长码和变长码 等长码:码字由位数相同的码符号组成,码长l是 不变的常数。 变长码:码本中各码字的长度l可以不同。
第四章 无失真信源编码
第四章 无失真信源编码
4.1 信源编码的作用与构成
4.2 等长信源编码定理
4.3 变长码及其编码定理 4.4 几种信源编码方法
第四章 无失真信源编码
4.1 信源编码的作用与构成
信源编码:将信源输出的随机序列变换成码序 列,且能进行反变换或译码,同时使传送码 序列所需的信息率最小。 信源符号集S={S1,S2, ‥Sq},Si为消息符号 码符号集m={m1,m2, ‥mr},mi也称码元 由若干码元(如l位)组成一个码符号序列: Wi=m1m2‥ml,Wi被称为码字 则码字Wi中的码元有r种可能的取值,码长为l 所有码字构成的集合称为码本C
P( A ) 0
c
全部序列几乎都落入 A 集,且无对应的码字,故译 码错误概率趋于1。完成逆定理的证明。
第四章 无失真信源编码

结:
当每个信源符号必须输出的信息率为
R=(l /N )log r 时,只要R>H(S),这种编
码一定可以做到几乎无失真;
反之,当R<H(S)时,不可能构成无失真的编
第四章 无失真信源编码
二、离散信源变长编码定理
1、平均码长的概念
设信源:
编码后的码字:
对应的码长:
则平均码长:
(码符号/每信源符号)
平均码长是每个信源符号平均需用的码元数。
第四章 无失真信源编码
• 平均每个码元携带的信息量(编码后所需信道的 信息传输率):

R= 道每秒钟传输的信息量为:
• 若传输一个码符号平均需要t秒钟,则编码后信
H (S ) H (S ) 1 或: 1 log r H (S ) 但必须取无限长的信源符号(N→∞)进行统一编 N
第四章 无失真信源编码
例:已知某信源
S1 S 2 S3 S 4 S5 S6 S7 S8 S 0.4 0.18 0.1 0.1 0.07 0.06 0.05 0.04
第四章 无失真信源编码
无失真编码定理→第一极限定理 信源
限失真编码定理→第三极限定理
编码定理 离散信道编码定理
信道
连续信道编码定理
→第二极限定理
第四章 无失真信源编码
4.2 等长信源编码定理
一、等长码
信源符号Si(i=1,2, ‥‥ q)
码字Wi(i=1,2, ‥‥q)
若Wi中的码元有r种可能的取值,码长为l
第四章 无失真信源编码
由于N长的全部可能的序列有qN个,若只对属于 A 集的 M 个序列进行编码,则: rl> M 考虑③式,可得:r exp[N ( H (S ) )] log r H ( S ) 最终可得: N 其它 Ac 集内的序列会在译码时将发生差错,考虑 2 (S ) ①式可得差错概率:P( Ac ) Pe N 2 2 2 上式中, 和 为定值,只要N足够大,Pe 可以 2 (S ) 小于任一正数 ,即: 2 N 为达到差错要求, 2 (S ) 信源序列长 N须满足: N 2
H (S ) H (S ) 1 或: 1 log r H (S ) 但必须取无限长的信源符号(N→∞)进行统一编 N
第四章 无失真信源编码
注意:等长信源编码定理是把信源限定为离散无 记忆和平稳的,这些限制条件有的是能解除或减 弱的,而对于非平稳信源,或有记忆信源而言, 需再有一些限制,仍可成立。 对于连续信源,由于信息量趋于无限,不能完成 无失真编码,只可进行限失真编码。 编码定理使输出符号的信息率与信源熵之比接近1, 即编码效率: 码才能实现。
exp[( H (S ) ) N ] P(a N ) exp[( H (S ) ) N ]
第四章 无失真信源编码
序列处于 A 集中的概率必为集内各序列aN的概率 之和: P( A )
a N A
P(a P(a
N
) M
max P(a
a N A
N
的变换,使变换后新的码符号信源(信道的输入
信源)尽可能为等概率分布,以使新信源的每个
码符号平均所含的信息量达到最大,从而使信道
一起编码才可满足要求,这不便于工程实现。
第四章 无失真信源编码
4.3 变长码及其编码定理
一、变长码的基本概念
编码原则:出现概率大的符号用短码,概率小的符 号用长码,可提高编码效率。 问题:码字如何分离。变长码必须是唯一可译码, 才能实现无失真编译码。
1、码字可分离性
异前置码(前缀条件码):任一码字的前面任一起 始部分都不构成其它码字。这是码字可分离的充分 条件。译码时无需参考后续的码符号就能立即作出 判断,译成对应的信源符号,则称为即时码。
码;
R=H(S)时,为临界状态。
第四章 无失真信源编码
注意:等长信源编码定理是把信源限定为离散无 记忆和平稳的,这些限制条件有的是能解除或减 弱的,而对于非平稳信源,或有记忆信源而言, 需再有一些限制,仍可成立。 对于连续信源,由于信息量趋于无限,不能完成 无失真编码,只可进行限失真编码。 编码定理使输出符号的信息率与信源熵之比接近1, 即编码效率: 码才能实现。
即:
由于信源取值有q种,则N长信源序列就有qN种,
将qN种序列分成两个互补的集
A 和 A
c
I (a N ) A {a N : | -H ( S ) | } N I (a N ) C A {a N : | -H ( S ) | } N
第四章 无失真信源编码
根据随机序列aN的切比雪夫不等式,显然:
则不能实现无失真编码,而当N足够大时,译码错误 概率近似等于1,译码几乎必定出错。
第四章 无失真信源编码
定理证明:设N长符号组成的序列为aN,则相应的 切比雪夫不等式为:
相关文档
最新文档