游程编码及MH编码

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 p0
二元游程序列的概率特性和编码效率
原信源的二元序列是由“0”游程和“1”游程 交替出现而组成的,所以二元序列的熵应等于 两个游程长度信源熵之和除以它们的平均游程 长度之和。
H [ L(0)] H [ L(1)] H (X) H (p0 ) H (p1 ) l0 l1
二元游程序列的概率特性和编码效率
游程编码及MH编码
游程编码内容

游程编码的概念

二元相关信源的游程编码

二元游程序列的概率特性

多元相关信源的游程编码
游程编写RL)
又称游程长度或游长,指的是字符序列中各
个字符连续重复出现而形成字符串的长度
游程编码RLC
又称“游程长度编码”、“行程编码” 是将这种字符串序列映射成串的字符串的长 度和串的位置的标志序列。
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
001011 0000011 0000100 0101000 0101011 0010011 0100100 0011000 00000010 00000011 00011010 00011011 00010010 00010011 00010100 00010101 00010110 00010111 00101000 00101001 00101010
对于有记忆的二元信源,假设“0”游程长度的霍夫 曼编码效率为 o,“1”游程长度的霍夫曼编码效率 为1 ,则平均码长为
l0 H [ L(0)] , l1 H [ L(1)]
0
1
则两个游程的信息熵之和除以平均码长之和得到对应
的二元序列的编码效率

H [ L(0)] H [ L(1)] H [ L(0)] 0 H [ L(1)] 1
二元相关信源的游程编码
“0”游程: 连续出现“0”符号的段 “1”游程: 连续出现“1”符号的段
“0”游程长度L(0) “1”游程长度L(1)
游程序列:
用自然数标记的游程长度,映射成交替出
现的游程长度序列
二元相关信源的游程编码
例如某二元序列:
00010011111100000001…
游程序列: 3
MH编码
MH码表(二),组合基干码 RL长度 64 128 192 256 320 384 448 512 576 640 704 768 832 896 白游程码字 11011 10010 010111 0110111 00110110 00110111 01100100 01100101 01101000 01100111 011001100 011001101 011010010 011010011 黑游程码字 0000001111 000011001000 000011001001 000001011011 000000110011 000000110100 000000110101 0000001101100 0000001101101 0000001001010 0000001001011 0000001001100 0000001001101 0000001110010 RL长度 960 1024 1088 1152 1216 1280 1344 1408 1472 1536 1600 1664 1728 EOL 白游程码字 011010100 011010101 011010110 011010111 011011000 011011001 011011010 011011011 010011000 010011001 010011010 011000 010011011 000000000001 黑游程码字 000000111001 0000001110100 0000001110101 0000001110110 0000001110111 0000001010010 0000001010011 0000001010100 0000001010101 0000001011010 0000001011011 0000001100100 0000001100101 000000000001
白游程长度在0~63的情况居多,因此MH码的码字分为
结尾码(或称终端码)和组合码(或称形成码)两种
MH编码
MH编码方法: 1.黑白游程分别对应不同的编码表; 2.游程长度在0~63时,码字直接用相应的终 端码(结尾码)表示;
例:一行中连续19个白,接着连续30个黑, 即白游程长度为19,黑游程长度为30.查表 得码字为 0001100 000001101000
42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63
00101011 00101100 00101101 00000100 00000101 00001010 00001011 01010010 01010011 01010100 01010101 00100100 00100101 01011000 01011001 01011010 01011011 01001010 01001011 00110010 00110011 00110100
H ( p1 ) 同理: H [ L(1)] p0
二元游程序列的概率特性和编码效率
平均游程长度:
l0 E[ L(0)]

L (0) 1
L (0) 1


L(0) P[ L(0)]


L (0) 1 L(0) p1p 0
1 1 p1 2 (1 p0 ) p1
同理:
l1
E[ L(1)]

L> 2 n 1,需用两个或者两个以上的CA为码字。
二元相关信源的游程编码
截断处理:
L= 2n L= 2 n 1
… …

C00…00
n个

C00…01
n个
L= 2n 1 1 C11 …11 L=/> 2n 1 C00…00C00…00
n个

n个
L= 2n 2 1 C00…00C11…11
MH编码 MH编码方法:
4.规定每行都从白游程开始,若实际出现黑游
程开始的话,则在行首加上零长度白游程码字
,每行结束用一个结束码(EOL);
RL长度 白游程码字 黑游程码字 RL长度 白游程码字 黑游程码字 RL长度 白游程码字 黑游程码字
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
00110101 000111 0111 1000 1011 1100 1110 1111 10011 10100 00111 01000 001000 000011 110100 110101 101010 101011 0100111 0001100 0001000
假设o > 1,则有o > > 1
多元相关信源的游程编码
多元序列也存在相应的游程序列 多元序列变换成游程序列再进行压缩编码没有 多大意义 游程编码只适用于二元序列,对于多元信源, 一般不能直接利用游程编码
MH编码
MH编码内容

MH编码的概念

MH编码的方法

MH编码的特点
MH编码
MH编码是用于黑白二值文件传真的数据压缩。文件传 真是指一般文件、图纸、手写稿、表格、报纸等文件 的传真。它们是黑白二值的,即信源是二元信源q=2。 MH码分别对“黑”、“白”的不同游程长度进行霍夫 曼编码,形成黑、白两张霍夫曼码表。编译码通过查 表进行。 规定每行标准像素为1728个,根据统计结果可知,黑
二元游程序列的概率特性和编码效率 以此类推:
L(0)1 P[L(0)] p0 p1
P[ L(1)] p
易验证:
L (1) 1 1 0
p
p1 P[ L(0)] 1 1 p0 L (0) 1 p0 P[ L(1)] 1 1 p1 L (1) 1


二元游程序列的概率特性和编码效率
n个
n个

n个
二元游程序列的概率特性和编码效率
设二元无记忆信源“0”和“1”的概率分别为 p0和p1 ,可求得L(0)和L(1)的概率 若下一个符号是1,则L(0)=1,P[ L(0) 1] p1 1 p0 若下一个符号是“0”,再下一个符号是“1”,则 L(0)=2, P[ L(0) 2] p0 p1
0000110111 010 11 10 011 0011 0010 00011 000101 000100 0000100 0000101 0000111 00000100 00000111 000011000 0000010111 0000011000 0000001000 00001100111 00001101000
1
2
6
7


等长游程编码:
011 001010110111 …
二元相关信源的游程编码
游程越长,出现的概率越小;游程长度趋于无
穷时,其出现的概率也趋向于零。
按照霍夫曼编码的规则,概率越小,码长越长
,但小概率的码字对平均码长的影响较小。
所以在实际应用时,对长游程一般采用截断处
理的方法,将大于一定长度的长游程统一用等
logp1[
L (0) 1


L (0) 1 p0 p1 ] logp 0{
L (0) 1


L (0) 1 [ L(0) 1] p0 p1}
二元游程序列的概率特性和编码效率
熵:
p1 p1 H [ L(0)] log p1 p0 log p0 2 1 p0 (1 p0 ) p0 log p1 log p0 p1 H ( p0 ) p1
00001101100 00000110111 00000101000 00000010111 00000011000 000011001010 000011001011 000011001100 000011001101 000001101000 000001101001 000001101010 000001101011 000011010010 000011010011 000011010100 000011010101 000011010110 000011010111 000001101100 000001101101
长码编码。
二元相关信源的游程编码
截断处理:
选取适当的n值,游程长度定为1,2,…,2 n 1,2n ,大于 2n的都用游程为 2n 的码字来处理。

按概率大小进行霍夫曼编码,得到相应的码 n 2 字,游程为 的码字为C。


2n<L< 2 n 1 ,在C之后加一个n位的自然码A, A代表余数,以区分 2n - 2 n 1之间的不同长度。
熵:
H [ L(0)]
L (0) 1
P[ L(0)]log P[ L(0)]


L (0) 1



L (0) 1 L (0) 1 p0 p1 log p0 p1
L (0) 1
L (0) 1 p0 p1 log p1
L (0) 1


L (0) 1 L (0) 1 p0 p1 log p0

MH编码 MH编码方法:
3.游程长度在64~1728,用一个组合码加上一个
结尾码为相应码字;
例:白游程长度为65(=64+1),查表得码字,
11011┊000111
黑游程长度为856(=832+24),查表得码字,
0000001001101┊00000010111
MH编码
MH码表(一),结尾码(终端码)
000011011010 000011011011 000001010100 000001010101 000001010110 000001010111 000001100100 000001100101 000001010010 000001010011 000000100100 000000110111 000000111000 000000100111 000000101000 000001011000 000001011001 000000101011 000000101100 000001011010 000001100110 000001100111
相关文档
最新文档