信息论与编码(第二版)陈运主编课件第二章 (5)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对英语信源: 信息变差:
I 0 H 0 H
对离散信源,信源符号等概率分布时熵最大,其平 均自信息量记为: H0=log q 由于信源符号间的依赖关系使信源的熵减小,使下 式成立:

log q H 0 H1 H 2 ... H m1 ... H
信源符号之间依赖关系越强,每个符导提供的平均 信息量越小。 为此,引入信源的冗余度来衡量信源的相关程度(有 时也称为多余度)。

例1:英语----字母表
以英文字母组成的信源为例,信源的输出是英文字母组成的序 列。英文字母共26个加上空格共27个符号。所以由英文字母组成的 信源的最大熵: H0=log 27=4.76(比特/符号) 考虑到字母之间的依赖关系,可以把英文信源作进一步的近似, 看作为M阶马尔可夫信源。这样可以求得: H1=4.03 比特/符号 H2=3.32 比特/符号 H H3=3.1 比特/符号 H0 …… H=1.4 比特/符号
m
lim
1 m

H(X )
§2.2.5 信源冗余度
例 2.2.5
英文各个字符的统计概率如下:
空格:0.2 E:0.105 O:0.0654 A:0.063 I:0.055 R:0.054 H:0.047 D:0.035 C:0.023 F、U:0.025 M:0.021 P:0.175 Y、W:0.012 G:0.011 V:0.008 K:0.003 J、Q:0.001 Z:0.001 T:0.072 N:0.059 S:0.052 L:0.029
m
) H m 1
ei ) log p ( ak ei )
i 1 k 1
状态极限概率
马尔可夫信源稳定后各状态的极
限概率( N )
各态历经定理
P61
状态极限概率的求法,状态转移图
例 2.2.4
二阶马尔可夫信源{00 01 10 11} 香农线图:
0.2 01 0.5
0.8
00
0.5
0.5


?
冗余度与传输效率 冗余度与传输可靠性 冗余度与英语学习
2
一般有记忆信源用联合概率描述符号间的关联关
系,马尔可夫信源用条件概率(状态转移概率)
来描述符号间的关联关系;
3
马尔可夫信源记忆长度虽然有限,但依赖关系延 伸到无穷远。长为m的有限记忆信源符号间的依 赖关系仅限于每组内,组与组之间没有依赖关系;
4
马尔可夫信源的极限熵H m 1是条件熵, m长有记忆信源的极限熵是平均符号熵
pl ( xk ei ) P( X l xk S l ei )
plபைடு நூலகம்(
ej ei
xk
) P(
Sl e j
S l 1 ei
)
如果条件概率与l 无关, 称为时齐的。P 59
pl (
ei
) p(
xk
ei
)
pl (
ej
ei
) p(
ej ei
)
m阶马尔可夫信源
信源输出当前符号仅与前
面m个符号有关的马尔可夫信源。
m阶马尔可夫信源的数学模型 :
x1 x2 xn X P( X m1 xkm1 ) p( ) X1 X m xk1 xkm
k1 , k2 ,, km1 ,2,, n 1
B:0.0105 X:0.002
0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0
a
d
g
j
m
p
s
v
y
英文字母出现概率统计
信息熵的相对率:
H H0
信源的冗余度:
H H0 H 1 1 H0 H0
4.76 1.4 0.71 4.76
马尔可夫信源
以信源输出符号序列内各符号
间条件概率来反映记忆特性的一类信源。 某时刻输出符号仅与此刻信源所处的状态有 关; 某时刻所处状态由当前输出符号和前一时刻信 源状态唯一确定。
1
2
输出符号序列:X 1 X 2 X l 1 X l 输出状态序列:S1S2 Sl 1Sl 设l时刻信源处于ei , 输出xk
H lim H (
N
n n
XN X 1 X 2 X N 1
n
1 2 N
)
ak
N
lim{
N


n k1 1 k 2 1 k N 1
p(ak ak ak ) log p( ak ) log p(
N
ak ak ak
1 2 N
)}
N 1
lim{
信息论与编码
Information Theory and coding
内蒙古工业大学 电子信息工程系 宋丽丽
Email: songlili@imut.edu.cn
有记忆的特点:
1
2 3
有限记忆长度; 信源输出不仅与符号集有关,而且与状态有关;
发出一个个符号,每发一个符号状态要发生转移。
状态
有限的相关符号组构成的序列
H 3 0.801(bit sign )
ej
1
H 并非在任何情况下都存在,对n元 m阶马尔可夫信源
1
平稳信源(如果不平稳则先把其变成分段平
稳的)。
2
p(e j )存在,j 1, 2, , n
m
2
m阶马尔可夫与一般记忆长度为m的有记忆信源 的区别:
马尔可夫信源发出一个个符号,有限长度有记忆 1 信源发出一组组符号;
N


k N m 1 n k N 1
n
p ( ak ak
N m
ak
N m 1
ak a k
N m
)}
N 1



k1 1 k m1 1
n
n
p (ak ak ) log p(
1 m 1
ak
m 1
ak ak
1
)
m
H(
n
X m 1
X1 X m ak p (ei ) p (
熵的相对率:=0.29 信源剩余度:=0.71
1 1
H H0

英文信源的剩余度说明:
文中有71%是由语言结构定好的;
只有29%是写文字的人可以自由选择的。 在传递或存储英语信息时,那些有关联的字母可进 行大幅度地压缩。 例如100页的书,大约只要存储29页就可以了,其 中71页可以压缩掉。 信源的剩余度表示这种信源可压缩的程度。 德语、法语等自然语言与英语类似,而汉语信源则 复杂得多。
11
0.8
0.5
10
0.2
p(e j ) p(ei ) p( ) ei i e1 ) p(e ) p(e1 ) p(e1 ) p(e1 ) p( 2 e1 e2 e1 ) p(e ) p(e1 ) p(e3 ) p( 4 e3 e4 0.8 p(e1 ) 0.5 p(e3 ) 2 5 p (e2 ) p(e3 ) p(e1 ) p(e4 ) 14 14
相关文档
最新文档