信息论算术编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
C ( a, b, d , a ) C ( a, b, d ) A(a, b, d ) Pa 0.010111 0.000001 0 0.010111 A( a, b, d , a ) A( a, b, d ) p 0.000001 0.1 0.0000001 a
率编码的目的。
算术编码
• 如果信源符号集为A={ a1,a2,……an },已知的信源符号概率P=[ p(a1), p(a2),……p(an) ]=( p1,p2,……,pr,……,pn),定义各符号的积累概率为:
Pr pi
i 1
r 1
由上式可得P1=0,P2=p1,P3=p1+p2,……且
C (ab) C (a) A(a) Pb 0 0.1 0.1 0.01 A(ab) A(a) pb 0.1 0.01 0.001
算术编码
C (a, b, d ) C (a, b) A(a, b) Pd 0.01 0.001 0.111 0.010111 A(a, b, d ) A(a, b) pd 0.001 0.001 0.000001
符号累积概率Pj
0.000 0.100 0.110 0.111
算术编码
• 设起始状态为空序列,则A()=1,C()=0。递推得:
C (a ) C ( ) A( ) Pa 0 1 0 0 A(a ) A( ) pa 1 0.1 0.1
因此,C(a,b,d,a)即为编码后的码字010111 。
算术编码Leabharlann Baidu
算术编码过程:(单位区间的划分表示) A()
0(Pa) C() 1 C(a)
pa
a A(a,b) C( a , b ) a b a b A(a)
Pb
b
pb
Pc
c
pc
Pd
d
pd
c
d
A(a,b,d) c d
C(a,b,d)
算术编码
C ( S,r ) C ( S ) A( S ) Pr A( S,r ) A( S ) pr
算术编码
• 例5—10 有四个符号a,b,c,d构成简单序列S=abda,各符号及其对应概率 如下表,算术编解码过程如下:
符号
a b c d
符号概率pi
0.100 (1/2) 0.010 (1/4) 0.001 (1/8) 0.001 (1/8)
第三个符号为d;
•
放大至[0,1](×p d-1):0×24=0 [0,0.1]
四个符号为a;
算术编码
• 算术编码优缺点: 算术编码从性能上看具有许多优点,特别是由于所需的参数很少,不象哈 夫曼编码那样需要一个很大的码表,常设计成自适应算术编码来针对一些信 源概率未知或非平稳情况。
但是在实际实现时还有一些问题,如计算复杂性、计算的精度以及存储量
以及序列概率公式:
p(S,ar)=p(S)pr
算术编码
• 码字的取得: 1. 码字的长度:
1 L log p( S )
代表大于或等于的最小整数。
2. 把积累概率P(S)写成二进位的小数,取其前L位;如果有尾数,就进位到第L
位,这样得到一个数C 。
算术编码
• 实际应用中,采用累积概率P(S)表示码字C(S),符号概率p(S)表示状态区间 A(S),则有:
P(S,1)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)+p(0110)
=P(S)+p(0110)=P(S)+p(S)p0
算术编码
• 由于单符号的累积概率为P0=0,P1=p0,所以上面两式可统一写作: P(S,r)=P(S)+p(S)Pr, r=0,1 • 推广到多元序列(m>2),即可得一般递推公式: P(S,ar)=P(S)+p(S)Pr,
第五章 信源编码
算术编码
定长编码定理 无失真信源编码 变长编码定理 — 最佳变长编码 信源编码 游程编 码 算术编码 限失真信源编码(常用) 矢量量化 预测编码 变换编码
香农编码方法 费诺编码方 法 哈夫曼编码方法
算术编码简介
• 是非分组码的编码方法之一。它是从全序列出发,考虑符号间的依赖关 系,即考虑符号间的相关性。 • 经香农—费诺—哈夫曼编码推广而来的,直接对信号源符号序列进行编
算术译码过程: C(a,b,d,a)=0.010111<0.1[0,0.1] 第一个符号为a;
•
放大至[0,1](×pa-1):C(a,b,d,a)×21=0.10111[0.1,0.110]
去掉累积概率Pb: 0.10111-0.1=0.00111;
第二个符号为b;
•
放大至[0,1](×p b-1):0.00111×22=0.111 [0.111,1] 去掉累积概率Pd: 0.111-0.111=0
码输出。
• 即时码,信源符号序列对应的累计概率区间是不重叠的。肯定也可以唯 一译码。
算术编码
• 编码的基本思路:从全序列出发,将各信源序列的概率影射到 [0,1]
区间上,使每个序列对应这区间内的一点,也就是一个二进制的小数。
这些点把 [0,1]区间分成许多小段,每段的长度等于某一序列的概率。
再在段内取一个二进制小数,其长度可与该序列的概率匹配,达到高效
等,随着这些问题的逐渐解决,算术编码正在进入实用阶段,但要扩大应用 范围或进一步提高性能,降低造价,还需进一步改进。
谢 谢!
pr=Pr+1—Pr
算术编码
• 由于Pr+1和Pr都是小于1的正数,可用[0,1]区间内的两个点来表示,则pr就是这 两点间的小区间的长度,如图所示:
0(P1) p1
P2 p2
P3 p3
P4 p4
P5
……
1
……
算术编码
• 有一序列S=011, P(S)=p(000)+p(001)+p(010), P(S,0)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101) =p(000)+P(001)+P(010)=P(S)
率编码的目的。
算术编码
• 如果信源符号集为A={ a1,a2,……an },已知的信源符号概率P=[ p(a1), p(a2),……p(an) ]=( p1,p2,……,pr,……,pn),定义各符号的积累概率为:
Pr pi
i 1
r 1
由上式可得P1=0,P2=p1,P3=p1+p2,……且
C (ab) C (a) A(a) Pb 0 0.1 0.1 0.01 A(ab) A(a) pb 0.1 0.01 0.001
算术编码
C (a, b, d ) C (a, b) A(a, b) Pd 0.01 0.001 0.111 0.010111 A(a, b, d ) A(a, b) pd 0.001 0.001 0.000001
符号累积概率Pj
0.000 0.100 0.110 0.111
算术编码
• 设起始状态为空序列,则A()=1,C()=0。递推得:
C (a ) C ( ) A( ) Pa 0 1 0 0 A(a ) A( ) pa 1 0.1 0.1
因此,C(a,b,d,a)即为编码后的码字010111 。
算术编码Leabharlann Baidu
算术编码过程:(单位区间的划分表示) A()
0(Pa) C() 1 C(a)
pa
a A(a,b) C( a , b ) a b a b A(a)
Pb
b
pb
Pc
c
pc
Pd
d
pd
c
d
A(a,b,d) c d
C(a,b,d)
算术编码
C ( S,r ) C ( S ) A( S ) Pr A( S,r ) A( S ) pr
算术编码
• 例5—10 有四个符号a,b,c,d构成简单序列S=abda,各符号及其对应概率 如下表,算术编解码过程如下:
符号
a b c d
符号概率pi
0.100 (1/2) 0.010 (1/4) 0.001 (1/8) 0.001 (1/8)
第三个符号为d;
•
放大至[0,1](×p d-1):0×24=0 [0,0.1]
四个符号为a;
算术编码
• 算术编码优缺点: 算术编码从性能上看具有许多优点,特别是由于所需的参数很少,不象哈 夫曼编码那样需要一个很大的码表,常设计成自适应算术编码来针对一些信 源概率未知或非平稳情况。
但是在实际实现时还有一些问题,如计算复杂性、计算的精度以及存储量
以及序列概率公式:
p(S,ar)=p(S)pr
算术编码
• 码字的取得: 1. 码字的长度:
1 L log p( S )
代表大于或等于的最小整数。
2. 把积累概率P(S)写成二进位的小数,取其前L位;如果有尾数,就进位到第L
位,这样得到一个数C 。
算术编码
• 实际应用中,采用累积概率P(S)表示码字C(S),符号概率p(S)表示状态区间 A(S),则有:
P(S,1)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)+p(0110)
=P(S)+p(0110)=P(S)+p(S)p0
算术编码
• 由于单符号的累积概率为P0=0,P1=p0,所以上面两式可统一写作: P(S,r)=P(S)+p(S)Pr, r=0,1 • 推广到多元序列(m>2),即可得一般递推公式: P(S,ar)=P(S)+p(S)Pr,
第五章 信源编码
算术编码
定长编码定理 无失真信源编码 变长编码定理 — 最佳变长编码 信源编码 游程编 码 算术编码 限失真信源编码(常用) 矢量量化 预测编码 变换编码
香农编码方法 费诺编码方 法 哈夫曼编码方法
算术编码简介
• 是非分组码的编码方法之一。它是从全序列出发,考虑符号间的依赖关 系,即考虑符号间的相关性。 • 经香农—费诺—哈夫曼编码推广而来的,直接对信号源符号序列进行编
算术译码过程: C(a,b,d,a)=0.010111<0.1[0,0.1] 第一个符号为a;
•
放大至[0,1](×pa-1):C(a,b,d,a)×21=0.10111[0.1,0.110]
去掉累积概率Pb: 0.10111-0.1=0.00111;
第二个符号为b;
•
放大至[0,1](×p b-1):0.00111×22=0.111 [0.111,1] 去掉累积概率Pd: 0.111-0.111=0
码输出。
• 即时码,信源符号序列对应的累计概率区间是不重叠的。肯定也可以唯 一译码。
算术编码
• 编码的基本思路:从全序列出发,将各信源序列的概率影射到 [0,1]
区间上,使每个序列对应这区间内的一点,也就是一个二进制的小数。
这些点把 [0,1]区间分成许多小段,每段的长度等于某一序列的概率。
再在段内取一个二进制小数,其长度可与该序列的概率匹配,达到高效
等,随着这些问题的逐渐解决,算术编码正在进入实用阶段,但要扩大应用 范围或进一步提高性能,降低造价,还需进一步改进。
谢 谢!
pr=Pr+1—Pr
算术编码
• 由于Pr+1和Pr都是小于1的正数,可用[0,1]区间内的两个点来表示,则pr就是这 两点间的小区间的长度,如图所示:
0(P1) p1
P2 p2
P3 p3
P4 p4
P5
……
1
……
算术编码
• 有一序列S=011, P(S)=p(000)+p(001)+p(010), P(S,0)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101) =p(000)+P(001)+P(010)=P(S)